Школа по ML в биоинформатике: «отличная возможность для нетворкинга и изучения нового материала»
Факультет компьютерных наук НИУ ВШЭ провел ежегодную летнюю школу по машинному обучению в биоинформатике, слушателями которой стали более 300 человек из разных университетов, институтов и организаций. Всего на событие зарегистрировались более 800 человек. Трехдневная программа включала в себя лекции и семинары.
В первый день участники могли узнать, откуда берется генетическое разнообразие, как большие языковые модели применяются в геномике и как такие модели создаются в биоинформатике. Во второй день школы спикеры рассказывали о биоинформатике в ДНК-тестированиях и о том, как она помогает выявлять заболевания, а также о вычислительных предсказаниях эффектов мутаций. В завершающий день поговорили о генеративных моделях в белковом дизайне и использовании белковой языковой модели для поиска B-клеточных эпитопов.
Спикерами выступили преподаватели и исследователи Международной лаборатории биоинформатики и Международной лаборатории статистической и вычислительной геномики ФКН ВШЭ, представители факультета биоинженерии и биоинформатики МГУ, а также МФТИ, AIRI, Genotek.
Слушатели и спикеры поделились впечатлениями от участия в летней школе и рассказали о своей сфере интересов в биоинформатике.
Мария Попцова, главный организатор школы, заведующая Международной лабораторией биоинформатики ФКН, академический руководитель магистратуры «Анализ данных в биологии и медицине»
— Эволюция архитектур нейросетевого глубинного обучения идет стремительными темпами. Речь о больших языковых и генеративных диффузионных моделях. В таком же темпе, с небольшим запозданием, происходит адаптация этих моделей к задачам биоинформатики.
На школе у нас получилось показать развитие двух направлений: применения больших языковых моделей к анализу геномов и белков, а также использования генеративных диффузионных моделей к генерации белковых минибайндеров — нового поколения лекарств.
Также мы гордимся тем, что в качестве лекторов удалось привлечь ведущих специалистов области.
Александр Ракитько, директор по науке Genotek
— Я уже не в первый раз участвую в летней школе по ML в биоинформатике, поэтому заранее был уверен, что все сложится. Быстро удалось наладить контакт с участниками, и почти сразу лекция превратилась в дискуссию. Время пролетело незаметно. Слушателям было интересно узнать о современных ДНК-тестах. Помимо лекции прошли и практические занятия. Удивлен, но некоторые ребята продолжили работать и делиться результатами уже после их завершения.
В мире больших данных легко оторваться от реальности и затеряться среди бесконечных нулей и единиц. Мне хотелось показать, что при определенных навыках и усердии можно достичь переднего края науки и решать задачи, которые важны и полезны людям.
Порадовала разнопрофильность участников школы: биологи с медиками, программисты, были и ребята, достигшие успехов в биоинформатике. Это важно, ведь, кроме сильного состава преподавателей и интересных лекций, весьма ценны знакомства и совместная работа с другими участниками. В такой среде рождаются стартапы и многолетние коллаборации.
Я бы хотел пожелать участникам школы использовать полученные знания как ориентир для выбора будущей профессии. Конечно, не все из них станут биоинформатиками. Но надеюсь, многие будут вспоминать школу как хороший и полезный опыт.
Дмитрий Пензар, преподаватель факультета биоинженерии и биоинформатики МГУ, научный сотрудник AIRI
— Я занимаюсь машинным обучением в регуляторной геномике уже семь лет и на летней школе хотел погрузить участников в эту область. Перспективы у сферы огромные — без успехов в ней о доступной персонализированной медицине можно забыть. При этом из-за ИИ-хайпа и не до конца честных статей невозможно самостоятельно понять, какие задачи в области решены.
Если коротко — нормально решенных задач нет. Особенно если ставить планки вида AlphaFold2. Любые разумные требования геномными моделями выполняются плохо. Но отсутствие решения — это не плохо, а, наоборот, хорошо, ведь есть возможность быть именно тем, кто это решение найдет.
На лекции мы обсудили, как нам могут помочь ДНК-языковые модели, одноклеточные данные, персонифицированные геномы и то, на чем я фокусировался в ходе докторантуры, — массовые параллельные эксперименты с репортерами. Также на примере архитектуры LegNet от нашей лаборатории мы обсудили, каким деталям стоит уделять внимание при решении биологических задач.
Любая область науки требует уважения к себе. Ошибка многих специалистов по машинному обучению, приходящих в ML в биологии, — наплевательское отношение к биологии. Ошибка биологов — восприятие машинного обучения как готового инструмента, который надо взять наугад из чьей-то статьи и запустить, не пытаясь разобраться.
Если хочется делать хорошую работу в нашей области, надо быть внимательным и к биологическим, и к ML-мелочам.
Дмитрий Умеренков, AIRI
— Приятно пообщаться с таким количеством молодых и увлеченных студентов. Огромное спасибо организаторам за предоставленную возможность.
В дополнение к нашей лекции мы подготовили практическое задание для участников, предложили им оценить качество двух реальных вакцин от COVID-19, чтобы наглядно продемонстрировать важность и ответственность задач, стоящих сегодня перед биоинформатиками.
Желаю участникам активнее вовлекаться в проекты, которые их действительно интересуют.
Марк Мирный, студент 4-го курса бакалавриата Института биологии и биотехнологии ВятГУ
— Было интересно поучаствовать в летней школе. Мне как «мокрому» биологу (ученый, работающий в лаборатории с реактивами. — Ред.) многое было непонятно, но ведущие секций отвечали на все интересующие вопросы. Эта школа — отличная возможность для нетворкинга и изучения нового материала. Надеюсь, смогу принять участие в следующем году.
Александра Кривицкая, младший научный сотрудник группы молекулярного моделирования федерального исследовательского центра «Фундаментальные основы биотехнологии» РАН
— Я считаю, что эта школа полезна как начинающим специалистам, так и состоявшимся специалистам из других областей. Первые получают необходимые вводные материалы для дальнейшей работы, вторые — информацию, чтобы иметь представление о развитии смежной области знаний. Для меня школа оказалась очень полезной. Большое спасибо за организацию такого мероприятия!
Евгений Бойко, студент 2-го курса ОП «Программная инженерия» ФКН
— Биоинформатика мне интересна как сочетание ML-технологий с генетикой, которое еще и имеет прикладной характер.
Больше всего мне понравился последний день школы, так как спикеры не только хорошо провели лекции, но и дали попрактиковаться. Интересная практическая часть была у Александра Ракитько: там и покодить дали возможность, и поработать с биологическими базами.
В будущем хотелось бы, чтобы на школе организовали больше разной практики. Мне кажется, это еще сильнее вовлекло бы слушателей в процесс.
Вам также может быть интересно:
Анализ генетической информации поможет избежать осложнений после инфаркта
Исследователи из НИУ ВШЭ разработали модель машинного обучения, которая предсказывает риск развития осложнений у пациентов, перенесших инфаркт миокарда. В модели впервые учли генетические данные, что позволило точнее оценить риск долгосрочных осложнений. Исследование опубликовано в журнале Frontiers in Medicine.
Fall into ML 2024: взгляд в будущее машинного обучения
25–26 октября в Москве состоялась конференция Fall into ML, организованная Институтом искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ совместно с Центром ИИ при поддержке титульного партнера — Сбера. На протяжении двух дней ведущие специалисты в области искусственного интеллекта обсуждали перспективы развития фундаментальных технологий ИИ.
«Наша система позволяет предотвращать сбои в работе центров обработки данных»
Студент первого курса магистерской программы «Продуктовый подход и аналитика данных в HR-менеджменте» Константин Балцат с командой единомышленников разработали систему прогнозирования отказов жестких дисков на основе машинного обучения. С этим проектом они второй год подряд входят в число лучших на хакатоне «Цифровой прорыв». «Вышка.Главное» побеседовала с Константином о разработках инноваций и учебе в университете.
НИУ ВШЭ и ПСБ провели хакатон по ИИ для студентов ведущих вузов страны
В конце сентября онлайн-кампус НИУ ВШЭ и ПСБ организовали хакатон для студентов, которые увлекаются анализом данных, визуализацией и машинным обучением, а также студентов креативных индустрий. На хакатон зарегистрировалось 620 человек, приняло участие 428 человек из разных регионов РФ. За первое место боролись студенты лучших российских университетов, а также учащиеся из других государств. Победителями турнира стала команда из Вышки.
«В третий раз соберем на площадке ВШЭ лучших ученых и исследователей ИИ в России»
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Центр ИИ 25–26 октября в Москве организуют конференцию Fall into ML 2024. Главной темой ежегодного мероприятия станут перспективы развития фундаментального искусственного интеллекта. Титульным партнером конференции выступит Сбер.
От секвенирования к разработке кардиопанели: как прошла летняя школа по кардиогенетике
С 19 по 29 августа Центр непрерывного образования факультета компьютерных наук НИУ ВШЭ совместно с Институтом аналитического приборостроения РАН, Институтом спектроскопии РАН и компанией «Синтол» провел летнюю школу «Кардиогенетика: от секвенирования к разработке кардиопанели». Школа проводилась в рамках Федеральной научно-технической программы развития генетических технологий на 2019–2027 годы (проект 15.ИП.21.0004).
Летняя школа по аналитике и Data Science в НИУ ВШЭ собрала более 400 слушателей
В конце августа в Центре культур Вышки прошла Летняя школа по аналитике и Data Science, организованная Центром непрерывного образования факультета компьютерных наук. Более 400 участников слушали выступления спикеров из «Яндекса», Ozon, X5 Group, VK, МТС, «Авито», Альфа-Банка, «Купера», ecom.tech, Wildberries, «Вкусно — и точка», «Эйч», а также сотрудников ФКН.
Курсы по возобновляемой энергии, кунг-фу и китайскому языку: что еще студенты Вышки изучали на летних школах вузов КНР
24 студента бакалавриата и магистратуры Международного института экономики и финансов НИУ ВШЭ на каникулах побывали в Китае, где приняли участие в летних школах ведущих университетов. Учебные заведения предоставили десятки разнообразных курсов на выбор: от экономики и права до танцев и спорта. Сегодня студенты делятся впечатлениями от обучения и поездки.
Genotek стал партнером магистерской программы ВШЭ «Анализ данных в биологии и медицине»
В сентябре 2024 года сотрудники медико-генетического центра Genotek выступят преподавателями и руководителями курсовых работ и магистерских диссертаций на программе «Анализ данных в биологии и медицине» факультета компьютерных наук НИУ ВШЭ. Экспертиза компании в анализе BigData и биоинформатической обработке данных секвенирования позволила переработать учебный план программы с учетом современных методов анализа данных в биологии и медицине.
«Это незабываемые впечатления, я сохраню их навсегда»: как проходит Международная летняя школа Питерской Вышки
Международная летняя школа Питерской Вышки в самом разгаре — именно сейчас зарубежные студенты из 12 стран активно посещают лекции и наслаждаются культурной программой. Поговорили с некоторыми из них о самых ярких впечатлениях.