Telegram Group Search
Цена жизни: женский опыт этнических чисток в сталинский период в Центральной Азии. Доклад Юлии Ященко

Очередной семинар "Цифровая история Центральной Азии" состоится 4 апреля в 14:15 CEST в гибридном режиме.

Язык: английский.

Для участников из России: "Германское общество изучения Восточной Европы" (DGO), являющееся соорганизатором семинара, признано в России нежелательной организацией.

Регистрация: https://fau.zoom-x.de/meeting/register/u5Upc-2qpjotGtfYoZFbo7dwT3R8jrUSnZjB
До 8 апреля продлен прием заявок на открытый воркшоп «Изучение языкового разнообразия литературных премий», который проводит Центр машинного обучения, анализа данных и статистики (МАСТ) Европейского университета https://eusp.org/projects/otkrytyy-vorkshop-izuchenie-yazykovogo-raznoobraziya-literaturnykh-premiy
Конференция «Гуманитарные проблемы актуальных наук: цифровая дисциплина и проект» (15–17 апреля, ИТМО)

Междисциплинарные и цифровые области гуманитарного и социального знания как будто отгорожены от других. Когда цифровой филолог рассуждает в своем докладе о байесовской статистике и доверительных интервалах, филолог нецифровой может смотреть на него со смесью страха и непонимания, а то и вообще не признавать это частью филологии. Возникает иллюзия, что «цифровым» гуманитариям не о чем говорить с «аналоговыми», а техноантропологи опираются на другую версию антропологии, чем «традиционные».

Обсудить проблему дистанции между гуманитарными науками и их цифровыми ответвлениями можно будет 15–17 апреля на конференции «Гуманитарные проблемы актуальных наук: цифровая дисциплина и проект». Конференция пройдет офлайн в DH-центре Университета ИТМО и на других площадках, а также онлайн. И участвовать, и слушать можно как очно, так и дистанционно.

Полная программа — на сайте, там же ссылка на решистрацию. Если вы планируете прийти на конференцию на все три дня — зарегистрироваться нужно на каждый из них.

На конференции будут не только классические форматы в духе докладов, дискуссий и круглых столов, но и серия специальных мероприятий, которые мы подготовили с нашими коллегами: секция о сохранении цифрового наследия вместе с ПАНДАНом, встречи о чтении гипертекстов и тексте в интерфейсе вместе с Пушкиным <цифровым>, лекции и воркшопы от приглашённых спикеров, вечеринки открытия и закрытия.
Forwarded from RAntiquity (Olga Alieva)
Публикуем первую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (2024, НИУ ВШЭ).

Лекцию о данных в гуманитарных науках прочел к.и.н., доцент кафедры исторической информатики исторического факультета МГУ, руководитель Института цифровых гуманитарных исследований СФУ Андрей Юрьевич Володин.

Встречу провели руководитель магистерской программы НИУ ВШЭ "Цифровые методы в гуманитарных науках" Борис Орехов и доцент Школы философии и культурологии НИУ ВШЭ Ольга Алиева @rantiquity.

В ближайшее время поделимся анонсом следующей лекции, оставайтесь с нами.

#criticaldh #курсы
Forwarded from Ебаный DH
5 коллекций данных для цифрового гуманитария

Интернет набит данными, но очень немногие датасеты сделаны гуманитариями и для гуманитариев. Собрал пять чисто гуманитарных источников данных, которые хорошо использовать в курсе анализа данных или программирования на DH-программах.

🎭 1. DraCor — корпуса и датасеты вокруг драматических текстов (с уклоном в network analysis, но не только). Один из очень немногих проектов, сумевших на базе “гуманитарного” стандарта TEI построить классную экосистему гуманитарных данных. Самые приятные данные дракора — это метаданные для каждого корпуса, которые вы можете скачать прямо на страничке корпуса, например, вот табличка для русского корпуса: https://dracor.org/api/v1/corpora/rus/metadata/csv Тут и классические метаданые вроде дат написания и публикации, и сетевые вроде плотности социальной сети в пьесе, и например соотношение мужской и женской речи…

Еще для каждой отдельной пьесы можно скачать сетевые данные (в gexf/csv/gml), речь персонажей, сценические ремарки… Ну и полную разметку в TEI, из которой все эти данные произрастают.

✒️ 2. Репозиторий открытых данных по русской литературе и фольклору — проект Цифровой лабы Пушкинского дома (ИРЛИ РАН), где цифровые филологи и не только публикуют датасеты и (иногда) код к своим исследованиям. Своего рода гуманитарный papers with code. Вот, например, данные и код к статье Кирилла Маслинского о том, какие животные чаще встречаются в каких жанрах детской литературе.

А еще там публикует новые датасеты сам ПушДом. Многие из них называются очень романтично. Скажем, Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)… Датасет с таким названием нужно обрабатывать под звуки романса “Отцвели уж давно хризантемы в саду”🍂

📚 3. European Literary Text Collection (ELTeC) — корпуса европейских романов, собранные с прицелом на репрезентативность и сопоставимость друг с другом. Целью было найти для каждой европейской литературы по 100 романов в диапазоне 1840-1920, чтобы они покрывали период более-менее равномерно, чтобы были представлены не только писатели-мужчины, чтобы бли длиной не менее 10000 слов и т.д. Не для всех корпусов это удалось, а русский корпус там совсем странный, но тем не менее — одна из немногих попыток сделать датасет, пригодный для “компаративистики” by design.

🏛 4. Госкаталог Музейного фонда РФсвалка датасет по всему, что оцифровано во всех музеях России. Не так часто в нашей области можно найти наборы данных, где записей не тысячи, но миллионы. Качество очень разное, репрезентативность тоже под вопросом, но жемчужин в этом океане данных тоже море. Одну я здесь уже описывал.

🗺 5. Геоданные DHCLOUD. Тут лежат литературные карты в geojson, сделанные студентами гуманитарного факультета Вышки под руководством Бориса Орехова. Картографированы самые разные тексты: от маршрута Афанасия Никитина и до Приключений Капитана Врунгеля 🐳
Полностью финансируемая PhD позиция по цифровым гуманитарным наукам/социальным наукам с применением методов Text Mining.

Междисциплинарная исследовательская группа ищет PhD студента для проекта по изучению индустриальной модернизации и глубинных переходов в Институте социальных исследований Тартуского университета (Эстония) под руководством Лаура Кангера. Работа будет фокусироваться на выявлении долгосрочных трендов индустриальной модернизации с использованием Text Mining оцифрованных газет и существующих баз данных.

Срок подачи заявок - 15.05.2024.

https://ut.ee/en/content/phd-open-calls (navigate to “1-15 May and 1-15 June 2024” > “Faculty of Social Sciences” > “Media and Communication, Sociology” tab)
🖇 Остатки/отходы или новые локусы научного знания? Что таится в цифровых архивах и как меняется наше взаимодействие с научными данными в диджитале?

24 апреля приглашаем всех гуманитариев на заседание научно-методического семинара «Цифровая среда». Присоединяйтесь онлайн, тема весьма интересная.

Наш гость и докладчик – исследовательница на стыке Digital Humanities, истории науки и медиа-археологии, постдок в Политехнической школе Лозанны (EPFL) и в Люксембургском центре современной и цифровой истории (C2DH) Алина Волынская.

💬 «В своем докладе я предложу своеобразную герменевтику цифрового научного архива как места производства знания и «места памяти» науки. Используя корпус научных коллекций и сочетая количественный и качественный подходы, рассмотрю вопрос о том, как цифровой архив моделирует наше взаимодействие с научным прошлым. Что мы можем узнать о науке прошлого из ее остатков, когда они дигитализируются и превращаются в данные? Какие интерпретации цифровой архив науки делает возможными и каковы, напротив, его эпистемологические ограничения?» 

В роли оппонента – доктор философских наук, лектор университета Лотарингии в Нанси (Франция) Андрей Родин.

→ Ссылка на подключение к семинару придет на почту накануне мероприятия – нужно только
зарегистрироваться.

🔴 Начало: 15.00 (мск)/ 19.00 (крск)

#цифроваясреда #цифровойархив
Please open Telegram to view this post
VIEW IN TELEGRAM
НКРЯ выкладывает в открытый доступ свои модели.
На сайте Национального корпуса русского языка появился новый раздел, посвящённый нейросетевым моделям, которые используются для разметки слов и текстов Корпуса.

Теперь пользователям доступны:
- токенизатор
- векторные модели для поиска слов-ассоциатов, адаптированные для 7 доменов
- модели для словообразовательной разметки
- модели для разметки тематики, жанров, типов текстов

Новый раздел будет полезен всем, кто интересуется обработкой естественного языка и хочет узнать больше о том, какие технологии машинного обучения применяются в НКРЯ. Пользователи могут ознакомиться с описанием моделей и скачать их для собственного использования. Перед скачиванием модели надо ознакомиться с лицензионным соглашением и принять его условия.
вакансия_аналитик_младший.pdf
152.6 KB
Вакансия DH-специалиста в Институте востоковедения РАН
Описание в прикрепленном файле
Цифровой Чехов: зачем и как именно создается семантическое издание произведений Антона Павловича

Уже в эту среду, 22 мая, приглашаем вас на заседание онлайн-семинара «Цифровая среда» с профессором кафедры лингвистики и профессиональной коммуникации ЮФУ Еленой Севериной.

Chekhov Digital – семантическое издание Полного собрания сочинений и писем А. П. Чехова, которое разрабатывается совместно Южным федеральным университетом и Центром гуманитарных исследований НИУ ВШЭ.

На семинаре Елена Михайловна расскажет о
→ процессе трансформации литературных произведений в структурированные машиночитаемые данные
→ методах и инструментах, которые реализуются в проекте Chekhov Digital
→ перспективах использования семантических данных для исследовательских и образовательных целей и планах по расширению проекта.

В роли дискутанта выступит доцент Школы лингвистики НИУ ВШЭ Анастасия Бонч-Осмоловская.

Ведущий семинара – доцент кафедры исторической информатики МГУ, руководитель стратегического проекта ИЦГИ (DHRI) Андрей Володин.

🟢 Начало: 15:00 (мск) / 19:00 (крск)

❗️Напоминаем о том, что на мероприятие нужно предварительно зарегистрироваться.

🟢 Посмотреть записи предыдущих выпусков «Цифровой среды».

#цифроваясреда #литература #семантика #смотреть #слушать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Для тех, кто опоздал к бурным обсуждениям больших языковых моделей в прошлом году, или, наоборот, кто хочет быть в курсе последних новостей в этой сфере.

В конце мая в рамках Костомаровского форума в Институте Пушкина прошел круглый стол с пушкинским названием «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей».

В дискуссии на круглом столе принимали участие доктор физико-математических наук Константин Воронцов, руководитель образовательной программы «Цифровые методы в гуманитарных науках» НИУ ВШЭ и сооснователь DH CLOUD Борис Орехов (о трудностях и решениях этих трудностей при построении такой магистерской программы можно послушать февральский доклад Бориса Орехова на специализированной конференции) и директор по стратегическим коммуникациям Brand Analytics Василий Черный.

Дискуссию можно посмотреть в записи или почитать материал о ней на Грамоте.

Главный лейтмотив дискуссии, к которому много раз обращались участники, в итоге сформировался вокруг того, что теперь можно будет одним нейросетям поручить писать тексты, другим читать их, а мы тем временем сможем «пойти на речку за червячками».
Широко известен эффект, который дают операции с векторами слов (о них можно почитать в главе про анализ текста в монографии Цифровые гуманитарные исследования и послушать в лекции Д. А. Рыжовой на курсе Критическое введение в Digital Humanities в НИУ ВШЭ): если вычесть из вектора слова «король» вектор слова «мужчина» и прибавить вектор слова «женщина», то получится вектор, близкий к вектору слова «королева».

Ученые из DH CLOUD выяснили, что этот эффект был предсказан 🔮 в классической русской литературе, а именно — в пьесе Гоголя "Женитьба": "Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича, да взять сколько-нибудь развязности, какая у Балтазара Балтазарыча, да, пожалуй, прибавить к этому ещё дородности Ивана Павловича".
Forwarded from RAntiquity (Olga Alieva)
💎 Как говорил Гераклит, начало и конец -- одно и то же, и наш курс, закруглившись, пришел к вводной лекции. Мы сделали полный круг: поговорили о различных инструментах и подходах в DH, а теперь пришло время посмотреть на отрасль в целом.

Свои рассуждения о DH в общенаучном контексте предложил руководитель магистерской программы “Цифровые методы в гуманитарных науках”, доцент Школы лингвистики НИУ ВШЭ Борис Орехов.

Одним из неожиданных выводов лекции стала мысль о том, что междисциплинарность невозможна, а самые интересные цифровые исследования посвящены традиционным вопросам гуманитарных дисциплин. Когда же DH пытаются быть "просто" набором цифровых инструментов, это выглядит глупо наивно.

Вот такой парадоксальный вывод курса получился. Видео всех лекций вы можете найти на сайте: http://criticaldh.ru/

На следующей неделе планируем еще одно мероприятие, оставайтесь на связи. #criticaldh
Please open Telegram to view this post
VIEW IN TELEGRAM
Поздравляем дружественных антиварваров с заслуженной победой!
Forwarded from Antibarbari HSE (Olga Alieva)
🥁 Как сообщают с места событий, сегодня телеграм-канал Antibarbari HSE стал победителем Конкурса лучших русскоязычных научных и научно-популярных работ НИУ ВШЭ! Жюри отметило нас среди лучших научно-популярных ресурсов по направлению «Филология».

🙂 Мы также поздравляем наших постоянных авторов Ирину Макарову и Бориса Орехова.

💘 Статья Ирины Владимировны «Народная мудрость в диалоге Аристотеля “О философии”» взяла приз в научной номинации по направлению «Философия и религиоведение».

💝Борис Валерьевич получил приз за научно-популярный проект «Некраткие содержания» (направление «Филология») и за научную публикацию «Индивидуальная семантика Л.Н. Толстого в свете векторных моделей» (направление «Лингвистика»).

Поздравляем коллег и очень гордимся сотрудничеством! Спасибо всем, кто поддерживает нас лайками, репостами и лучами добра.

Будем же еще научнее, еще популярнее. Euge!
Please open Telegram to view this post
VIEW IN TELEGRAM
Сергей Кокин: Рассекречивание архивных документов и предоставление доступа к ним: опыт Украины (1991–2024)

Приглашаем на очередной семинар ”Цифровая история (в) Центральной Азии”, где в этот раз будет тема архивных документов и архивных проектов в Украине (в том числе совместных проектов со странами ЦА).

13 июня, 14:15 CEST / 15:15 Киев / 17:15 Ташкент и Алматы / 18:15 Бишкек / Эрлангене и Zoom.

Эксперт: Сергей Кокин, старший научный сотрудник Института истории Украины Академии наук Украины, бывший сотрудник архива Службы безопасности Украины.

Доклад посвящен процессу рассекречивания архивных документов в Украине с 1990-х годов до настоящего времени. Сейчас доступ к рассекреченным оцифрованным материалам предоставляется в читальном зале Архива Службы безопасности Украины в Киеве, ограничения на доступ к ним были сняты в 2014–2015 годах. Также будут рассмотрены созданные в стране базы данных репрессированных и реабилитированных лиц, а также международные проекты, реализуемые в том числе совместно со странами Центральной Азии.

Язык доклада: русский, вопросы могут задаваться на русском, украинском английском, немецком.

Для регистрации и получения ссылки напишите Динаре Гагариной (@dinaraamirovna или [email protected]).
“ЦИФРОВОЙ ГУМАНИТАРИЙ” – ЗВУЧИТ НЕОБЫЧНО И ПАРАДОКСАЛЬНО?
Магистерская программа “Цифровые методы в гуманитарных науках” НИУ ВШЭ
❤️ приглашает на вебинар для поступающих.
Ссылка на вебинар.
В субботу 15 июня в 13.00 (мск.) мы ждем 🔘 тех, кто:
📖 … уже является специалистом в гуманитарной области и хочет научиться применять новейшие компьютерные методы в работе с гуманитарным знанием;
👀 … на “ты” с программированием, анализом данных, статистикой и другими цифровыми технологиями – и хочет с их помощью узнавать новое про литературу, историю и культуру;
☕️ … всех, кому интересно как: подружить нейросети с поэзией, создать цифровую копию Помпей, вычислить настоящего автора шекспировских пьес, построить компьютерную модель “Войны и мира”, научить компьютер расшифровывать древние манускрипты – и многое другое!
Руководители и преподаватели расскажут о магистерской программе и ответят на ваши вопросы.
🔗 Наш сайт: https://www.hse.ru/ma/dh
🖥 Наше сообщество: https://telegram/com.dhcloud.org/
🆕 Наши новости: https://www.tg-me.com/telegram/com.dhcloud https://www.tg-me.com/rantiquity
💬 Наши люди: Борис Орехов, Ольга Алиева, Анастасия Бонч-Осмоловская и др.
Please open Telegram to view this post
VIEW IN TELEGRAM
2024/06/14 21:48:27
Back to Top
HTML Embed Code: