Tags op ISPam.nl (2)
Tuesday 17 July 2007 om 19:06 | In xCAT.nl Daily, xCAT.nl Initiatieven, xCAT.nl Techniek | No CommentsEnkele dagen geleden schreef ik over Tags op ISPam.nl en dat ik de simpele tagging software met een kleine hack verbeterd had. Ik ben nu redelijk op stoom (kunstmatige intelligentie achtige dingen is een passie van me), dus ik zat te denken hoe je het related content principe nog verder kunt verbeteren zuiver op basis van de tags.
Soorten tags
De tags zelf hebben ook een bepaalde betekenis. Je hebt namen, begrippen, zelfstandige naamwoorden, container begrippen, persoonsnamen, landen, plaatsen, functies, etc. Nu is aan de hand van welke betekenis(sen) een bepaalde tag heeft of kan hebben, veelal een stuk relevantie af te leiden, zeker als het om meerdere matches/hits gaat.
Tags wegen
De tags kun je ook wegen, als bijvoorbeeld een tag heel weinig voorkomt en deze matcht op artikelen dan is de kans groter dat deze twee bij elkaar horen, dan wanneer een bepaalde tag aan elk artikel is toegevoegd. Verder kun je ook tags ook manueel een bepaalde weging meegeven.
Tags clusteren
Veelal staan tags niet op zichzelf en hebben tags onderling ook een bepaalde relevantie, zo heb je bijvoorbeeld TLD, ccTLD, gTLD, sTLD en domeinnaam. Of SIDN, EURid, DNS.BE en DENIC. Aan de hand van clusters kun je dus ook weer afleiden of er een verdere relevantie is, buiten het matchen zelf kun je op basis van de matches in een cluster de match weer nauwkeuriger berekenen.
Er zijn naast deze drie mogelijkheden die ik bedacht heb nog veel meer mogelijkheden. Het mooiste vind ik persoonlijk matches die zonder menselijke aanwijzing kunnen worden gemaakt. Het simpelste is dan weging op basis van hoe vaak een bepaalde tag voorkomt. Misschien hebben jullie nog ideeen hoe je op basis van tags verdere relevantie in artikelen kan ontdekken?
No Comments yet »
RSS feed for comments on this post. TrackBack URI
Leave a comment
Powered by WordPress with Pool theme design by Borja Fernandez.
Entries and comments feeds.
Valid XHTML and CSS. ^Top^
