Data-intensive Web Applications built using client–server architectures usually provide prefetching mechanisms to enhance data accessibility. Prefetching is a strategy of retrieving data before it is requested so that it can be ready when the user requests it. Prefetching reduces the load on the web server by making data available before the user requests it. Prefetching can be used for static content, such as images and web pages, as well as dynamic content, such as search results. Prefetching can also be used to improve the performance of web applications, as the data is available quickly. There are several scheduling methods, such as time-based scheduling, event-based scheduling and priority-based scheduling, for prefetching to ensure that essential data is always ready when the user requests it. In this study, we focus on time-based scheduling for prefetching. We introduce time-based scheduling methodologies using sequential pattern mining techniques and long-term short memory-based deep learning strategies. To show the usefulness of these strategies, we develop a prototype application. We conduct an extensive experimental study to evaluate the performance of the proposed time-based scheduling methodologies using both performance and accuracy metrics. Based on the computed metrics, using proposed prefetching methods provided a promising cache hit rate when using the optimal cache size. The results show that the proposed prefetching methodologies are useful in data-intensive web applications for enhancing data accessibility. Work remains to investigate the use of attention-based sequence-to-sequence models in the web prefetching domain.
İstemcilerin (uçta çalışan cihazlar) ve sunucuların birlikte çalışması gereken sistemlerde makine öğrenmesi modeli kullanılması bir ihtiyaçtır. Ancak istemcilerden verilerin toplanması, sunucuya aktarılması, makine öğrenmesi modeli eğitilmesi ve ardından bu modelin istemcilerde çalışan cihazlara entegre edilmesi bir çok problemi beraberinde getirmektedir. Verilerin istemcilerden sunucuya transferi ağ trafiğine sebep olmakta ve fazla enerji gerektirmektedir. Bütün veriler aktarılacağı için veri mahremiyeti de istismar edilebilmektedir. Çalışma kapsamında, bu problemlerin çözümü için bir mimari önerilmektedir. Mimariye göre her bir istemcide kendi verilerinden bir makine öğrenmesi modeli eğitilmektedir. Eğitilen model sunucuya gönderilmekte ve sunucuda bu modeller birleştirilerek yeni bir model oluşturulmaktadır. Oluşturulan nihai model tekrar istemcilere dağıtılmaktadır. Bu sayede ağ trafiği azaltılmakta, enerji ihtiyacı düşürülmekte ve veri mahremiyeti bütün veriler yerine tek başına anlamsız olan veriler gönderildiği için korunmaktadır. Ayrıca tüm istemcilerdeki modeller güncel kalmaktadır. Bu çalışma kapsamında önerilen mimariye ait bir simülasyon ortamı oluşturulmuştur. Simülasyon ortamında iki farklı şekilde model eğitimi gerçekleştirilmiş ve elde edilen iki model kıyaslanmıştır. İlk model istemcilerden sunucuya verilerin aktarılmasıyla ve bu verilerden model eğitilmesiyle elde edilmiştir. İkincisi ise önerilen mimari olan istemcilerde model eğitilip sunucuda modellerin birleştirilmesi ile nihai modelin eğitilmesidir. Önerilen mimariyi simülasyonda gerçekleştirmek için Incremental Classification Based on Association (I-CBA) olarak adlandırılan algoritma geliştirilmiştir. I-CBA ve ilişkisel sınıflandırma algoritmalarından biri olan CBA kullanılarak, UCI veri havuzundan alınan beş veri kümesi ile modeller eğitilmiştir. Deneysel sonuçlar CBA ile karşılaştırıldığında, I-CBA ile model eğitim süresinin yaklaşık olarak %70 oranında azaldığını ve neredeyse aynı doğruluğu elde ettiğini göstermiştir. Bu sonuçlar önerilen mimarinin başarıya ulaştığını ortaya koymaktadır.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.