Почему нейросети генерируют бред, когда от них ждут правды? Как преодолеть разрыв между компьютерной лингвистикой и теоретической? Что мы можем узнать с помощью нейросетей о внутреннем устройстве языке, и на каком слое BERT «лежит синтаксис»? Каким должно быть образование в области Natural Language Processing?
Все это мы обсудили с новым гостем подкаста «Неопознанный искусственный интеллект» — руководителем направления в «SberDevices», одним из создателей семейства голосовых помощников «Салют» Денисом Кирьяновым. Яркие моменты выпуска:
- 01:33 — как делали голосовых помощников «Салют»
- 03:25 — чем машина все еще хуже человека: проблема целеполагания
- 06:53 — «писули» от «волшебной машины»: почему GPT-3 генерирует фейковые факты и выдуманные названия рок-групп
- 10:50 — как сделать персональных помощников более человекоподобными: проактивные ИИ-зануды
- 14:22 — как машине научиться делать то, чего она никогда не видела
- 16:55 — конец нейронного блицкрига: «забрасывать железом» компьютерно-лингвистические задачи больше не модно
- 17:59 — применение лингвистики в разработке голосовых помощников
- 19:07 — вычислительная лингвистика versus лингвистическая теория
- 24:30 — лингвисты между двумя стульями: преодолим ли разрыв между теоретиками и компьютерщиками
- 28:24 — что могут дать компьютерные модели теоретическим лингвистам
- 31:22 — когда нейросети начнут создавать новые теории
- 39:31 — ИИ будущего и межкультурные различия
- 40:54 — как должно быть устроено образование в области автоматической обработки языка
- 43:42 — Data Science в курятнике и кибер-village
Расшифровка подкаста
Ведущие подкаста: Даниил Скоринкин и Анатолий Старостин.
Над выпуском работали: Наталья Перкова, Этери Джафарова, Михаил Калра, Алена Завьялова, ВГ, Анастасия Хорошева и Илья Булгаков.
Подкаст издания Системный Блокъ. Пишите ваши вопросы и идеи на [email protected].