Обособленное подразделение ФГБУН ВолНЦ РАН
RuEn

Пятый обучающий семинар в рамках цикла лекций «Data Science в социальных науках» состоялся в ВолНЦ РАН

27 февраля 2025 г. прошел обучающий семинар «Анализ текстовых данных: от осмысления пройденного к новым горизонтам», в рамках которого были подведены промежуточные итоги по работе с неструктурированной информацией. В качестве докладчика выступил с.н.с. к.э.н. Андрей Васильевич Попов.

Участники семинара познакомились с ключевыми библиотеками и методами, помогающими автоматизировать обработку информации, извлекать полезные сведения из аудио- и видеофайлов, веб-страниц и текстовых документов, а также применять машинное обучение для анализа текстовых данных. Как и на прошлых занятиях, особое внимание было уделено технологии парсинга данных при помощи программного интерфейса API и веб-скрейпинга. После этого были рассмотрены инструменты для обработки текстовой информации, включая чистку, нормализацию и приведение к естественному языку. Это стало основой для дальнейшего анализа текстов и их применения в проектах, в т.ч. связанных с машинным обучением. В заключение обсуждались возможности и ограничения применения полученных знаний при проведении исследований и подготовке научных статей.

Чтобы быть в курсе последних новостей и иметь возможность активно участвовать в обучающих семинарах, можно подписаться на тематическую рассылку

По всем вопросам можно обращаться к Попову А.В.

Все сообщения