Derginin Adı:
|
Theoretical & Applied Science
|
Cilt:
|
2014/17
|
Sayı:
|
9
|
Makale Başlık:
|
DEVELOPMENT PROSPECTS OF DISTRIBUTED STORAGE OF BIG DATA
|
Makale Alternatif Dilde Başlık:
|
РАЗВИТИЕ РАСПРЕДЕЛЁННОГО ХРАНЕНИЯ СВЕРХБОЛЬШИХ ОБЪЁМОВ ДАННЫХ
|
Makale Eklenme Tarihi:
|
16.10.2014
|
Okunma Sayısı:
|
2
|
Makale Özeti:
|
The report presents an analysis of Big Data storage solutions in different directions. The purpose of this paper is to introduce the technology of Big Data storage, prospects of storage technologies, for example, the software DIRAC. The DIRAC is a software framework for distributed computing.
The report considers popular storage technologies and lists their limitations. The main problems are the storage of large data, the lack of quality in the processing, scalability, the lack of rapid availability, the lack of implementation of intelligent data retrieval.
The device features, functionality and operation methods for high -energy physics experiments DIRAC software are presented in the main part of the paper. Experimental computing tasks demand a wide range of requirements in terms of CPU usage, data access or memory consumption and unstable profile of resource use for a certain period. The DIRAC Data Management System (DMS), together with the DIRAC Storage Management System (SMS) provides the necessary functionality to execute and control all the activities related with data.
|
Alternatif Dilde Özet:
|
Под Big Data понимают огромные объемы (сотни петабайт) окружающей нас информации, которая может быть полезной для решения научных и бизнес-задач и для использования которой не подходят стандартные классические технологии хранения, обработки и анализа данных. Однако, в нашей деятельности активно используется и такая специфическая информация, как тексты, картинки, изображения, видео- и аудиопоказания приборов.
Обработка данных, к примеру, экспериментов ядерной физики требует доработки систем хранения и управления данных. Целесообразность разработки новых систем обработки подобных данных коммерческие организации определяют из конкретной задачи заказчика, и основным аспектом является количество и доступность. Однако, сверхбольшие наборы данных, активно обрабатываемые в научных проектах, значительно превышают объемы и требуют сохранения качества при обработке, масштабируемости, быстрой доступности, возможности изменения полученной информации и реализации интеллектуального поиска данных.
|