Голосов: 0
#1
Описание [Архэ] [Александр Пиперски] Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024):
Компьютерная лингвистика — это активно развивающаяся область, находящаяся на стыке теории и практики. Мы сталкиваемся с результатами её работы каждый день: это и машинный перевод, и поиск в интернете, и голосовые помощники, и многое другое. За всеми этими продуктами стоит кропотливая работа лингвистов и программистов.
В ходе курса мы рассмотрим историю компьютерной лингвистики и наиболее популярные методы, а также увидим, как они помогают решать практические задачи, такие как проверка орфографии или классификация новостей по темам.
7. Классификация, кластеризация и оценка сходства текстов
Одна из важных задач компьютерной лингвистики — группировка похожих текстов. Это может быть как разделение на заранее определённые категории («Спорт», «Политика» и т. д.), так и разделение на основе сходства самих текстов. Например, новостные агрегаторы сначала объединяют похожие тексты в один сюжет, а затем присваивают ему определённую категорию.
На занятии мы обсудим, как можно измерять расстояние между текстами, чем отличается задача классификации от задачи кластеризации и как эти задачи решаются.
Лектор: Александр Чедович Пиперски, кандидат филологических наук, доцент Института лингвистики РГГУ, научный сотрудник Школы филологии НИУ ВШЭ.
Подробнее:
Для просмотра содержимого вам необходимо авторизоваться
Скачать курс [Архэ] [Александр Пиперски] Компьютерная лингвистика. Классификация, кластеризация и оценка сходства текстов (2024):
Для просмотра содержимого вам необходимо авторизоваться
Последнее редактирование модератором: