Telegram Group Search
Между тем, начинается соревнование RuShiftEval. Оно посвящено детектированию изменения семантики русских слов во времени. Не сомневаемся, что большинство участников будут так или иначе использовать дистрибутивные модели.
Присоединяйтесь к соревнованию!
Forwarded from RuShiftEval
Началась Отладочная фаза соревнования RuShiftEval!

Мы приглашаем вас загрузить предсказания ваших систем для следующих 12 слов:

верховье
возраст
завод
закладка
земля
лох
помощник
пролетарий
промышленность
радикал
спутник
четверть

Starting kit с примером файла для загрузки на Codalab можно найти тут. Не забудьте заменить числа в файле на предсказания вашей системы.

Также напоминаем, что вы можете использовать диахронические word2vec-модели, обученные на соответствующих временных периодах НКРЯ. Скачать их можно здесь.
RusVectōrēs pinned «Началась Отладочная фаза соревнования RuShiftEval! Мы приглашаем вас загрузить предсказания ваших систем для следующих 12 слов: верховье возраст завод закладка земля лох помощник пролетарий промышленность радикал спутник четверть Starting kit с примером…»
Forwarded from RuShiftEval
Сегодня началась Тестовая фаза соревнования RuShiftEval'21. Вы уже можете загружать свои предсказания степени семантических изменений для 99 русских слов.
Ваш ответ должен представлять из себя текстовый файл (одно слово на строку), разделенный символами табуляции на 4 колонки. Первая колонка содержит слово, а следующие - три положительных числа, соответствующие степени семантического сдвига для этого слова в трёх парах временных периодов:
- до-советский и советский периоды,
- советский и пост-советский периоды,
- до-советский и пост-советский периоды.

Ещё раз напоминаем, что чем сильнее сдвиг, тем ниже должно быть значение в соответствующей колонке (то есть, значения соответствуют близости значений слова в разные периоды). Итоговая оценка генерируется как среднее арифметическое трех коэффициентов ранговой корреляции Спирмена (для трёх пар временных периодов) между вашими предсказаниями и ручной аннотацией.

Список слов для генерации оценок семантического сдвига можно скачать как Evaluation phase starting kit (или прямо тут в канале в предыдущем посте). Starting kit cсодержит рандомные значения сдвигов, которые вы должны заменить на реальные предсказания ваших систем.

Тестовая фаза длится, пока хоть где-то на Земле всё ещё продолжается 28 февраля. Каждая команда может загрузить максимум 10 ответов в этой фазе, так что расходуйте их с умом!
Важно: во время тестовой фазы лидерборд скрыт, так что вы не увидите сразу свои результаты.

Примечание: прямо сейчас Codalab вновь испытывает проблемы с HTTPS-сертификатом. К счастью, использование Chrome/Chromium (пока что) спасает.
А вот и статья, описывающая, как под капотом работает наш ELMoViz (визуализация контекстуализированных векторных репрезентаций в виде "двумерного текста"):

https://www.aclweb.org/anthology/2021.eacl-demos.18/
Пример работы сервиса
Напоминаем о нашем сайд-проекте RusNLP. Это поисковик по статьям, опубликованным на российских конференциях по компьютерной лингвистике: "Диалог", AIST, AINL.

Прямо
сейчас на "Диалоге" мы представляем RusNLP на постерной сессии. Если вам интересно, заходите поболтать в Zoom (программа конференции)

Подробнее о RusNLP:
Мы обкачали все публикации на этих конференциях, начиная с 2001 года, и тщательно разметили статьи по авторам и их аффилиациям.

Наш поисковик позволяет искать публикации по вашим запросам и отображает списки статей на схожую тему, независим от языка текста (английский или русский). Результаты поиска можно фильтровать по любому сочетанию авторов, аффилиаций, годов и конференций.
В честь совсем уже наступившего лета посмотрите этот отчёт о проекте по курсу программирования.
В этом рэпе упоминается RusVectōrēs (честно)!

https://www.youtube.com/watch?v=-6WHP1VoOiA
Конференция АИСТ в этом году пройдёт в декабре в солнечной Грузии, а именно в Тбилиси (также частично онлайн при поддержке Сколтеха).
Как и в предыдущие годы, на АИСТе планируется сильная NLP-секция, и мы будем очень рады вашим статьям!

Важные даты:
- Подача краткой аннотации до 1 сентября
- Подача основного текста до 15 сентября
- Решение до 1 ноября
- Конференция 16-18 декабря

Call for Papers

Видеозаписи докладов NLP-трека с прошлогоднего АИСТа

Подавайтесь, АИСТ ждёт вас в Тбилиси!
Всем привет,

Мы добавили на страницу визуализаций графики, полученные методом PCA (в дополнение к t-SNE). Их преимущество состоит в детерминированности: в отличие от t-SNE, PCA-проекция для данных слов и данной модели всегда одинакова. Если воспроизводимость визуализаций для вас критична, используйте PCA.

Кроме того, мы исправили множество мелких ошибок.

В ближайшие недели ожидайте обновление списка доступных моделей!
На RusVectōrēs теперь по умолчанию используется новая статическая модель ruwikiruscorpora_upos_cbow_300_10_2021, обученная на НКРЯ и дампе русской Википедии за ноябрь 2021 года. Она пришла на смену старой модели ruwikiruscorpora_upos_skipgram_300_2_2019

Встречайте все ваши любимые коронавирусные неологизмы!
Внимание!
Сегодня могут наблюдаться проблемы с доступом к сайту RusVectōrēs, но мы работаем над этим, никакой катастрофы не случилось.
Мы против войны, которую развязала Россия и мы солидарны с Украиной. Поэтому сейчас RusVectōrēs по умолчанию переключен на модель, обученную на украинской Википедии и CommonCrawl (корпус CoNLL-2017).
Прежние модели по-прежнему доступны для выбора в соответствующих вкладках или через API.
#нетвойне
RusVectōrēs pinned «Мы против войны, которую развязала Россия и мы солидарны с Украиной. Поэтому сейчас RusVectōrēs по умолчанию переключен на модель, обученную на украинской Википедии и CommonCrawl (корпус CoNLL-2017). Прежние модели по-прежнему доступны для выбора в соответствующих…»
Статья, описывающая RusVectōrēs, была впервые представлена на конференции AIST-2016 и опубликована в её сборнике.

Так что для нас AIST особенно дорог и мы всячески призываем вас к участию в AIST-2023, который пройдёт в Ереване в конце сентября.
Дедлайн подачи абстрактов уже через три дня, поторопитесь! 🔬
Forwarded from AIST conference
Let us officially announce here AIST-2023 to be held in Yerevan, Armenia 28 though 30 of September 2023! Submission deadline is July 15. All the details are available at our web site.

CALL FOR PAPERS

Dear colleagues,

We are excited to invite you to submit a paper to AIST-2023, a scientific conference on Analysis of Images, Social Networks, and Texts. The conference is intended for researchers and practitioners interested in data science focusing on innovative applications of data analysis and machine learning techniques to image processing, analysis of network data, text processing, and other domains, such as economics or geographic information systems.

Similar to the previous years, the main volume of the conference proceedings will be published in the Springer’s in Lecture Notes in Computer Science (LNCS) series (Q2).

Venue

The conference continues to travel in a beautiful (and tasty!) region. This year AIST will be held offline in Yerevan, Armenia. More specifically the event is organized with support of Zaven & Sonia Akian College of Science & Engineering, American University of Armenia. Besides the scientific knowledge you will enjoy a good season in Armenia and dive into local culture. The conference will feature representatives of the local data analysis community.
Tracks

Submission can be made in one of the following tracks chaired by experts in the respective fields:

- Natural Language Processing
- Computer Vision
- Data Analysis and Machine Learning
- Network Analysis
- Theoretical Machine Learning and Optimization

More generally we are encouraging submission on any application of deep learning and data analysis including, but not limited to the following topics:

- Analysis of images and video
- Analytics for geoinformation systems
- Computational linguistics
- Core data mining and machine learning techniques
- Discovering and analyzing processes using event data
- Deep learning applications
- Educational data mining
- Game analytics
- Machine learning and data mining for economics and social sciences
- Natural language processing and applications
- Optimization problems in complex networks
- Recommendational systems and collaborative technologies
- Semantic web and ontologies
- Social network analysis

Important Dates
- Abstract deadline June 31, 2023
- Submission deadline July 15, 2023
- Notification of acceptance August 15, 2023
- Camera-ready papers due September 1, 2023
- Conference dates September 28 – 30, 2023
All deadlines are 11.59 pm UTC -12h ("anywhere on Earth").

https://aistconf.org/
2024/04/19 18:18:12
Back to Top
HTML Embed Code: