Big data перевели на русский

В России утвержден первый национальный стандарт в области больших данных
15.07.2021
Валерий Кодачигов, Татьяна Исакова

Росстандарт утвердил терминологические нормативы, которым должны следовать участники рынка больших данных, следует из приказа ведомства, с которым ознакомились «Ведомости». Такой стандарт вводится впервые, следует из его описания.

ГОСТ «Информационные технологии. Большие данные. Обзор и словарь» идентичен международному стандарту Information technology - Big data - Overview and vocabulary, подчеркивают его разработчики из Национального центра цифровой экономики МГУ и Института развития информационного общества. Разработка стандарта осуществлена в рамках бюджетной программы государственной поддержки центра компетенций «Национальной технологической инициативы» (НТИ) по технологиям хранения и анализа больших данных МГУ, отмечает представитель АНО «Платформа НТИ».

«Термины, установленные настоящим стандартом, обязательны для применения во всех видах документации и литературы по данной научно-технической отрасли, входящих в сферу работ по стандартизации и (или) использующих результаты этих работ», - отмечено в описании стандарта.

В ГОСТе приведены переводы англоязычных терминов, относящихся к большим данным, на русский язык и расшифровка их значений. Например, «аналитика данных» (data analytics) - это «составное понятие, охватывающее получение, сбор, проверку и обработку данных, включая их количественную оценку, визуализацию и интерпретацию». А, к примеру, «вариативность данных» (data variability) - «изменения в скорости передачи, формате или структуре, семантике или качестве массива данных». Ниже приводятся ключевые характеристики больших данных (объем, скорость обработки, разнообразие и вариативность) с объяснением их значения.

«Принятие первого национального стандарта задает вектор совместных действий власти, бизнеса, научно-образовательного сообщества по развитию экономики данных в России, - отмечает председатель совета директоров Института развития информационного общества Юрий Хохлов. - Мы ставим перед собой задачу сократить отставание в стандартизации больших данных». Первыми в IT-отрасли вводятся терминологические стандарты, а затем к ним добавляются все остальные, объясняет он.

По словам Хохлова, предстоит принять еще восемь национальных стандартов в сфере больших данных, касающихся их эталонной архитектуры, безопасности, методов анализа, сценариев использования и др.: «Часть из них уже разработана, прошла общественное обсуждение, часть будет разрабатываться одновременно с международными стандартами».

По состоянию на конец 2019 г. Boston Consulting Group оценивала объем российского рынка больших данных в 45 млрд руб. с темпом прироста 12% в течение последних пяти лет. Согласно подсчетам Ассоциации больших данных, объем рынка больших данных в России составляет 10-30 млрд руб. При этом, по усредненным прогнозам российских и иностранных экспертов, к 2024 г. ожидается рост этого показателя до 300 млрд руб.

Терминологический стандарт действительно необходим, считает председатель технического комитета «Кибер-физические системы» при Росстандарте Никита Уткин: «Он должен позволить участникам рынка больших данных общаться на одном языке - терминологическое единообразие нужно, например, для составления закупочной документации, технических заданий и техдокументации».

«На этот терминологический аппарат можно будет опираться при создании регуляторных документов», - отмечает руководитель направления Big Data КРОК Кристина Проскурнина.

Представитель Mail.ru Group считает, что стандартизация терминов - полезное дело, так как она уменьшает недопонимание между участниками рынка: «Если предложенная терминология поможет в структурировании общения на заданную тему, это неплохо. Особенно для тех компаний, которые только начинают работать с большими данными».

В мире уже существует несколько международных стандартов для больших данных, определяющих понятия и термины, говорит директор Института исследований интернета Карен Казарян: «Поэтому действия Росстандарта вполне логичны. Но для бизнеса этот стандарт ничего не меняет, это, по сути, лишь словарь терминов, с которыми участники рынка больших данных и так прекрасно знакомы».

Скорее это словарь для чиновников, зачастую довольно смутно представляющих, что такое big data, - компаниям он поможет разве что при госзакупках, резюмировал Казарян.

Хотелось бы, чтобы в разработку стандартов больших данных бизнес был вовлечен глубже, заключает Уткин.-

Терминологический стандарт действительно необходим, считает председатель технического комитета «Кибер-физические системы» при Росстандарте Никита Уткин: «Он должен позволить участникам рынка больших данных общаться на одном языке - терминологическое единообразие нужно, например, для составления закупочной документации, технических заданий и техдокументации».

Международный опыт
Первый интернациональный стандарт в сфере big data «Большие данные - Требования на основе облачных вычислений и их возможности» Международный союз электросвязи утвердил в 2015 г. В 2018 г. Международная организация по стандартизации (ISO) утвердила стандарты эталонной архитектуры больших данных, сценариев использования big data, а также направления дальнейшей стандартизации больших данных. В 2020 г. ISO опубликовала стандарты безопасности при использовании персональных данных в big data - проектах и начала работу над серией стандартов о качестве больших данных для аналитики и машинного обучения.

«На этот терминологический аппарат можно будет опираться при создании регуляторных документов», - отмечает руководитель направления Big Data КРОК Кристина Проскурнина.

Представитель Mail.ru Group считает, что стандартизация терминов - полезное дело, так как она уменьшает недопонимание между участниками рынка: «Если предложенная терминология поможет в структурировании общения на заданную тему, это неплохо. Особенно для тех компаний, которые только начинают работать с большими данными».

В мире уже существует несколько международных стандартов для больших данных, определяющих понятия и термины, говорит директор Института исследований интернета Карен Казарян: «Поэтому действия Росстандарта вполне логичны. Но для бизнеса этот стандарт ничего не меняет, это, по сути, лишь словарь терминов, с которыми участники рынка больших данных и так прекрасно знакомы».

Скорее это словарь для чиновников, зачастую довольно смутно представляющих, что такое big data, - компаниям он поможет разве что при госзакупках, резюмировал Казарян.

Хотелось бы, чтобы в разработку стандартов больших данных бизнес был вовлечен глубже, заключает Уткин.

Источник: Vedomosti.ru

Читайте другие наши материалы