Открытый доступ - необходимое условие инновационного развития

14 декабря 2015

Во второй день Общероссийского саммита «Открытые данные – 2015» эксперты обсудили лингвистические методы разработки, опыт публикации, методологию сбора и анализа открытых данных, а также рассмотрели роль данных в data-журналистике, образовании и науке.

Особое внимание на круглом столе «Место и роль открытых данных в больших данных» было уделено проблеме пересечения персональных и больших данных. Эксперт Аналитического центра Юрий Аммосов уверен, что эти данные не тождественны, но могут пересекаться друг с другом, если касаются одного и того же человека. Также участники дискуссии отметили, что в этой сфере существует множество неоднозначных понятий, поэтому необходимо как можно быстрее прописать определение «больших данных» и обозначить направления их деятельности.

На сессии «Опыт публикации открытых данных» представители регионов рассказали о своей практике, об инструментах упрощения и проверки соответствия наборов методическим рекомендациям. Санкт-Петербург смог адаптировать отображение своего портала на устройствах с разным разрешением экрана и визуализировать статистические данные о его работе, также город уже осуществляет загрузку информации из сторонних систем. Пермский край только начал работать в этом направлении, но уже сделал огромный рывок, перейдя от количества данных к их качеству. Все регионы стремятся к электронному взаимодействию с разными структурами и к автоматизированному режиму обновления информации. «Сфера открытых данных только начинает формироваться, поэтому очень важно рассказывать общественности о наилучших технологиях, чтобы новые участники смогли пользоваться проверенными методами», - считает представитель ЗАО «Госбук» Юрий Линьков. Для этого нужно пополнять реестр успешных проектов на Портале открытых данных, проводить различные мероприятия и объединять представителей отрасли, уверен эксперт.

Научная коммуникация расширяется через открытие научных публикаций, а у нас пока Минобрнауки находится на 32 месте среди ФОИВов по открытости данных. Но уже в 2016 году 60% всех научных публикаций будет выложено в открытом доступе. 

Дмитрий Семячкин, директор ассоциации «Открытая наука», руководитель проекта «КиберЛенинка»



«Открытые данные - это недавно появившаяся практика обработки цифровых массивов информации для принятия и обоснования управленческих решений», - сказала эксперт Аналитического центра Галина Градосельская на круглом столе «Методология сбора и анализа открытых данных». Но в этом направлении есть большая проблема, заключающаяся в отсутствии единой разработанной методологии, считает эксперт. Так, в каждой сфере деятельности есть свои инструментарии, отличающиеся друг от друга. По мнению специалистов, в России эта проблема возникла из-за позднего начала развития отрасли и оформления основного портала без продуманной специфики и подготовленных потребителей информации. При этом в США и Европе есть свои методологии, но для нашего государства они не подходят. В ходе обсуждения участники мероприятия выработали шаги, которые нужно сделать для создания единой отечественной методики, удовлетворяющей интересы всех сторон отрасли.   

Участники сессии «Открытые данные в образовании и науке» обсудили роль открытых данных в повышении эффективности научных исследований  и доступности их результатов. Эксперт Аналитического центра Инна Каракчиева, модерировавшая мероприятие, особо отметила необходимость публикации открытых данных по всем исследованиям, на которые выделяются государственные гранты. Представитель Федеральной службы по труду и занятости Ирина Анисимова считает, что важной задачей является создание классификатора компетенций, который зафиксирует требования качественного работодателя к специалистам. «Научная коммуникация расширяется через открытие научных публикаций, а у нас пока Минобрнауки находится на 32 месте среди ФОИВов по открытости данных, - сообщил директор ассоциации «Открытая наука», руководитель проекта «КиберЛенинка» Дмитрий Семячкин. – Но уже в 2016 году 60% всех научных публикаций будет выложено в открытом доступе».  Проблему разрыва между образованием и реальным бизнесом отметил профессор РГСУ Сергей Неизвестный. По его мнению, необходимо менять программы обучения и мотивацию преподавательского состава в пользу открытия данных, чтобы компетенции выпускников соответствовали потребностям бизнеса.

Выступая на круглом столе «Лингвистические методы обработки данных», эксперты в этой области отметили, что для переработки больших объемов данных лингвистическая систематизация необходима. Методы компьютерной лингвистики нужны для извлечения фактов, их верификации, нормализации, агрегации и связывания. Исполнительный директор Ассоциации электронных торговых площадок Илья Димитров считает, что «без лингвистических технологий Big Data вообще не состоится». На круглом столе представители компаний, занимающихся лингвистической систематизацией данных, поделились опытом и рассказали о проблемах. Представленные системы самостоятельно ищут в контексте ключевые признаки и интерпретируют в нужный формат, их используют для защиты данных, обработки документов и т.д. Коммерческая ценность открытых данных начинается тогда, когда данные очищены и агрегированы, считают участники круглого стола. Они отметили, что в секторе наблюдается дефицит кадров – трудно найти специалистов, которые одновременно могут программировать и знают лингвистику, а также обратили внимание на тот факт, что сегодня зачастую одной технологии недостаточно – нужен набор технологий анализа, чтобы уменьшить количество ложных срабатываний.

Читайте также:

14.12.2015 - Открытые данные: мировой опыт и российские реалии

11.12.2015 - Открытые данные – качественно новая среда обитания

11.12.2015 - Эксперты говорят о востребованности открытых данных во всех областях