advertenties: Ontvang toegang tot het 200-niveau en studeer een cursus aan een universiteit naar keuze. Lage tarieven | Geen JAMB UTME. Bel 09038456231

Annoteren van zoekresultaten op internet

ADS! Verzamel tot N300,000 cash in de 2020 Aspire Contest

Annoteren van zoekresultaten op internet.

SAMENVATTING

Met meer dan miljoenen pagina's is het web een enorm enorme informatiebron geworden. Deze informatie is in de vorm van documenten, afbeeldingen, video's en tekst. Met zulke enorme hoeveelheden gegevens is het een veelvoorkomend probleem om de juiste informatie te krijgen die men wil.

Vaak moeten gebruikers met behulp van zoekmachines zoeken naar de juiste inhoud waarnaar ze op zoek zijn op internet. Zoeken kan handmatig worden gedaan door gebruik te maken van beschikbare platforms zoals Google of automatisch in de vorm van webcrawlers.

Omdat het semantische web niet gestructureerd is, kunnen zoekresultaten verschillende soorten informatie bevatten die betrekking hebben op dezelfde zoekopdracht. Soms kunnen deze resultaten niet direct worden geanalyseerd om aan de specifieke interpretatiebehoefte te voldoen.

De zoekresultaatrecords (SRR's) die na handmatige of automatische zoekopdrachten van het web worden geretourneerd, hebben de vorm van webpagina's met resultaten die zijn verkregen uit onderliggende databases. Dergelijke resultaten kunnen verder worden gebruikt in vele toepassingen zoals gegevensverzameling, vergelijking van prijzen enz.

Er is dus een behoefte om de SRR-machine verwerkbaar te maken. Om dat te bereiken is het belangrijk dat de SRR's op een zinvolle manier worden geannoteerd. Annotatie voegt waarde toe aan de SRR's doordat de verzamelde gegevens kunnen worden opgeslagen voor verdere analyse en de verzameling gemakkelijker leesbaar en begrijpelijk maakt.

Ook annotatie bereidt de gegevens voor op datavisualisatie. De SRR's met dezelfde concepten zijn gegroepeerd, waardoor het gemakkelijker wordt om vergelijkingen te maken en te analyseren en door de collectie te bladeren.

Het doel van dit onderzoek is om erachter te komen hoe zoekresultaten van het web automatisch kunnen worden geannoteerd en geherstructureerd om datavisualisatie mogelijk te maken voor gebruikers in een specifiek discoursdomein.

Er wordt een casestudy-applicatie geïmplementeerd die een webcrawler gebruikt om webpagina's op te halen over elk onderwerp in het domein van de volksgezondheid.

Dit onderzoek is een voortzetting van het werk van dhr. Emanuel Onu in het project "Voorstel van een tool om competitieve intelligentie op het web te verbeteren".

INLEIDING

Mensen van alle rangen en standen gebruiken internet voor zoveel verschillende taken, zoals het kopen en verkopen van items, sociale netwerken, digitale bibliotheken, nieuws, enz.

Onderzoekers hebben informatie nodig uit digitale bibliotheken en andere online documentopslagplaatsen om hun onderzoek uit te voeren en informatie te delen; geleerden hebben boeken nodig om informatie en kennis uit te halen; mensen communiceren met elkaar via e-mail via het web.

Anderen gebruiken sociale media om informatie uit te wisselen en om een ​​praatje te maken; sommigen voeren transacties uit zoals het kopen van artikelen en het betalen van rekeningen via internet. Het World Wide Web is tegenwoordig de belangrijkste "allerhande informatie" -opslagplaats en is tot dusverre zeer succesvol geweest in het verspreiden van informatie naar mensen.

Het web is het voorkeursmedium geworden voor veel databasetoepassingen, zoals e-commerce en digitale bibliotheken. Veel databasetoepassingen slaan informatie op in enorme databases die gebruikers via het web openen, opvragen en bijwerken.

Door de verbetering van hardwaretechnologieën is de opslagcapaciteit van computers en servers toegenomen. Als zodanig slaan veel webservers veel gegevens op hun opslagstations op.

Op sommige sociale media-websites, zoals Facebook [1], kunnen gebruikers afbeeldingen, video's en andere documenten uploaden. YouTube [2] stelt zijn gebruikers in staat video's van verschillende lengtes op hun servers te plaatsen.

Er zijn andere geautomatiseerde systemen die dagelijks veel gegevens verzamelen. Banksystemen moeten bijvoorbeeld dagelijkse Auto Teller Machine-transacties (ATM) opslaan, evenals transacties van andere klanten.

Sommige monitoringsystemen verzamelen gegevens over een bepaald aspect van het leven, bijvoorbeeld klimaatverandering, online winkelsystemen die informatie bijhouden over de dagelijkse winkelervaring van klanten.

REFERENTIES

Sriramoju1 SB, (2014). Een toepassing voor het annoteren van zoekresultaten op internet. International Journal of Innovative Research in Computer and Communication Engineering. 2 (3). 3306-3312.

Embley DW, Campbell DM, Jiang YS, Liddle SW, Lonsdale DW, Smith RD, (1999). Gegevensextractie op basis van een conceptueel model van webpagina's met meerdere records. Data & Knowledge Engineering (31). 227-251

Jadhao1 S., Kulkarni RP, (2014). Herziening van semantisch web, annotatiemethoden en automatische annotatie voor zoekresultaten op internet. International Journal of Engineering Research and Applications (IJERA) ISSN: 2248-9622. Internationale conferentie over industriële automatisering en computers (ICIAC - 12-13 april 2014)

Meagher P., (2004). Implementeer Bayesiaanse inferentie met behulp van PHP, deel 1. Bouw intelligente webapplicaties op basis van voorwaardelijke waarschijnlijkheid. IBM Developer Works. Document beschikbaar op: http://www.ibm.com/developerworks/library/wa-bayes1/wa-bayes1-pdf.pdf.

Handschuh S., Volz R., Staab S., (2004). Annotatie voor het deep web. IEEE INTELLIGENTE SYSTEMEN. Blz. 43-48.

Handschuh S. en Staab S., (2002). "Ontwerpen en annoteren van webpagina's in CREAM", Proc. 11e Int'l World Wide Web Conf., ACM Press, pp. 462-473.

Vul uw e-mailadres:

Geleverd door TMLT NIGERIA

Word nu lid van meer dan 3,500+ lezers online!


=> VOLG ONS OP Instagram | FACEBOOK & TWITTER VOOR LAATSTE UPDATES

ADS: KNOCK-OFF DIABETES IN SLECHTS 60 DAGEN! - BESTEL HIER

AUTEURSRECHT WAARSCHUWING! Inhoud op deze website mag niet opnieuw worden gepubliceerd, gereproduceerd, gedistribueerd, geheel of gedeeltelijk, zonder toestemming of erkenning. Alle inhoud wordt beschermd door DMCA.
De inhoud op deze site is met goede bedoelingen geplaatst. Als u eigenaar bent van deze inhoud en van mening bent dat uw auteursrecht is geschonden of geschonden, neemt u contact met ons op via [[Email protected]] om een ​​klacht in te dienen en zullen er onmiddellijk acties worden ondernomen.

Tags: , , ,

Reacties zijn gesloten.