В статье делается обзор существующих технологий и программных решений для хранения большого объема информации.Выбор технологии хранения данных, главным образом, влияет на производительность БД и всей системы в целом. Несмотря на то, что подходы и модели хранения сверхбольших данных непрерывно совершенствуются, как для крупных компаний, так и для научных групп организация хранения остается крайне трудоемким процессом. В большинстве случаев различные технологии хранения данных предназначены для решения конкретных задач.Цель настоящей работы -обобщить имеющийся опыт хранения сверхбольших данных, который мог бы стать основой для создания новых методов. Авторы рассматривают сильные и слабые стороны технологий, применяющихся для хранения и управления большими объемами данных: распределенные и параллельные БД, технология MapReduce, их особенности и области применения. Также делают сравнительный анализ возможностей существующих программных решений, реализующих эти модели. На основе анализа даны рекомендации, направленные на совместное использование реляционных и нереляционных моделей с целью объединения преимуществ обеих технологий.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.