Datainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdata

Webbapplikationers komplexitet och mängden avancerade tjänster ökar. Loggning av aktiviteter kan öka förståelsen över användares beteenden och behov, men används i för stor mängd utan relevant information. Mer avancerade system medför ökade krav för prestandan och loggning blir än mer krävande för s...

Full description

Bibliographic Details
Main Author: Karlsson, Sophie
Format: Others
Language:Swedish
Published: Högskolan i Skövde, Institutionen för informationsteknologi 2014
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-9467
id ndltd-UPSALLA1-oai-DiVA.org-his-9467
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-his-94672018-01-12T05:12:20ZDatainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdatasweData Collection with Web Usage Mining : Storage strategies for logging server side dataKarlsson, SophieHögskolan i Skövde, Institutionen för informationsteknologi2014Data CollectionWeb Usage MiningStorage strategiesLoggingServer side dataResponse timeANOVADatainsamlingLagringsstrategiLagringsstrategierLoggningServerdataSvarstiderANOVAComputer SciencesDatavetenskap (datalogi)Webbapplikationers komplexitet och mängden avancerade tjänster ökar. Loggning av aktiviteter kan öka förståelsen över användares beteenden och behov, men används i för stor mängd utan relevant information. Mer avancerade system medför ökade krav för prestandan och loggning blir än mer krävande för systemen. Det finns behov av smartare system, utveckling inom tekniker för prestandaförbättringar och tekniker för datainsamling. Arbetet kommer undersöka hur svarstider påverkas vid loggning av serverdata, enligt datainsamlingsfasen i web usage mining, beroende på lagringsstrategier. Hypotesen är att loggning kan försämra svarstider ytterligare. Experiment genomförs där fyra olika lagringsstrategier används för att lagra serverdata med olika tabell- och databasstrukturer, för att se vilken strategi som påverkar svarstiderna minst. Experimentet påvisar statistiskt signifikant skillnad mellan lagringsstrategierna enligt ANOVA. Lagringsstrategi 4 påvisar bäst effekt för prestandans genomsnittliga svarstid, jämfört med lagringsstrategi 2 som påvisar mest negativ effekt för den genomsnittliga svarstiden. Framtida arbete vore intressant för att stärka resultaten. Web applications complexity and the amount of advanced services increases. Logging activities can increase the understanding of users behavior and needs, but is used too much without relevant information. More advanced systems brings increased requirements for performance and logging becomes even more demanding for the systems. There is need of smarter systems, development within the techniques for performance improvements and techniques for data collection. This work will investigate how response times are affected when logging server data, according to the data collection phase in web usage mining, depending on storage strategies. The hypothesis is that logging may degrade response times even further. An experiment was conducted in which four different storage strategies are used to store server data with different table- and database structures, to see which strategy affects the response times least. The experiment proves statistically significant difference between the storage strategies with ANOVA. Storage strategy 4 proves the best effect for the performance average response time compared with storage strategy 2, which proves the most negative effect for the average response time. Future work would be interesting for strengthening the results. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-9467application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic Data Collection
Web Usage Mining
Storage strategies
Logging
Server side data
Response time
ANOVA
Datainsamling
Lagringsstrategi
Lagringsstrategier
Loggning
Serverdata
Svarstider
ANOVA
Computer Sciences
Datavetenskap (datalogi)
spellingShingle Data Collection
Web Usage Mining
Storage strategies
Logging
Server side data
Response time
ANOVA
Datainsamling
Lagringsstrategi
Lagringsstrategier
Loggning
Serverdata
Svarstider
ANOVA
Computer Sciences
Datavetenskap (datalogi)
Karlsson, Sophie
Datainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdata
description Webbapplikationers komplexitet och mängden avancerade tjänster ökar. Loggning av aktiviteter kan öka förståelsen över användares beteenden och behov, men används i för stor mängd utan relevant information. Mer avancerade system medför ökade krav för prestandan och loggning blir än mer krävande för systemen. Det finns behov av smartare system, utveckling inom tekniker för prestandaförbättringar och tekniker för datainsamling. Arbetet kommer undersöka hur svarstider påverkas vid loggning av serverdata, enligt datainsamlingsfasen i web usage mining, beroende på lagringsstrategier. Hypotesen är att loggning kan försämra svarstider ytterligare. Experiment genomförs där fyra olika lagringsstrategier används för att lagra serverdata med olika tabell- och databasstrukturer, för att se vilken strategi som påverkar svarstiderna minst. Experimentet påvisar statistiskt signifikant skillnad mellan lagringsstrategierna enligt ANOVA. Lagringsstrategi 4 påvisar bäst effekt för prestandans genomsnittliga svarstid, jämfört med lagringsstrategi 2 som påvisar mest negativ effekt för den genomsnittliga svarstiden. Framtida arbete vore intressant för att stärka resultaten. === Web applications complexity and the amount of advanced services increases. Logging activities can increase the understanding of users behavior and needs, but is used too much without relevant information. More advanced systems brings increased requirements for performance and logging becomes even more demanding for the systems. There is need of smarter systems, development within the techniques for performance improvements and techniques for data collection. This work will investigate how response times are affected when logging server data, according to the data collection phase in web usage mining, depending on storage strategies. The hypothesis is that logging may degrade response times even further. An experiment was conducted in which four different storage strategies are used to store server data with different table- and database structures, to see which strategy affects the response times least. The experiment proves statistically significant difference between the storage strategies with ANOVA. Storage strategy 4 proves the best effect for the performance average response time compared with storage strategy 2, which proves the most negative effect for the average response time. Future work would be interesting for strengthening the results.
author Karlsson, Sophie
author_facet Karlsson, Sophie
author_sort Karlsson, Sophie
title Datainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdata
title_short Datainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdata
title_full Datainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdata
title_fullStr Datainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdata
title_full_unstemmed Datainsamling med Web Usage Mining : Lagringsstrategier för loggning av serverdata
title_sort datainsamling med web usage mining : lagringsstrategier för loggning av serverdata
publisher Högskolan i Skövde, Institutionen för informationsteknologi
publishDate 2014
url http://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-9467
work_keys_str_mv AT karlssonsophie datainsamlingmedwebusagemininglagringsstrategierforloggningavserverdata
AT karlssonsophie datacollectionwithwebusageminingstoragestrategiesforloggingserversidedata
_version_ 1718606233607340032