Я несу пиздец. (c)
Так, ладно. Я потерялась. Вдруг у джаста будет больше идей.

У меня есть предмет в университете Machine Learning (машинное обучение) и мне нужно по нему будет сделать к концу этого семестра проект. Насколько сказали одногруппники, нам очень минимально рассказали, как его нужно сдать, и сказали "погуглите ML projects" для идей.

И так вот, я не очень понимаю формат. Не уверена, как мы должны будем Как я понимаю, презентации у нас не будет. Это чисто написать код с комментариями? Или потребуется что-то еще? Я подойду на днях к преподавателю, но мы должны были сдать тему МНОГО ДНЕЙ НАЗАД D: и в идеале прислать тему до того, как я пойду к учителю. Если у кого-то было, то расскажите, пожалуйста, какого это было формата, что вы вообще делали?

я немного работала c deep learning, и очень хотела бы в автоэнкодеры уйти. но не уверена, не утопит ли это меня.

@темы: Учеба: ищу материал!, Учеба: вопросы и советы

Комментарии
08.01.2020 в 17:52

А что у вас за специальность, какой именно МЛ? Я с этим работаю, но в основном с текстами, если хотите, могу написать в личку. Подозреваю, что нужно выбрать тему из курса, собрать интересные данные, чтобы это был не титаник-датасет, и что-то посчитать. Если хотите, напишите, постараюсь подсказать.
08.01.2020 в 18:02

Автоэнкодерами можно шумы в изображениях поубирать, например. Вообще, я бы отталкивалась с темой от доступных данных + чтобы задача была уже более-менее решена.

В целом я в магистратуре делала много проектов разной сложности — SOTA от вас никто не потребует, нужно просто сделать осмысленную работу, желательно не на банальных данных.
08.01.2020 в 20:39

Бог бесполезной недели
Это чисто написать код с комментариями?
Аналитический отчет, возможно? Код, комментарии - графики с пояснениями, описательная статистика, EDA, если есть, что рассказать о данных, какие-то пояснения по выбору конкретных подходов к подготовке данных и, собственно, по итоговой модели. Во всяком случае, именно такие штуки мне пригодились позже на работе.
Я бы поняла это именно так, как написала 10v в первом комменте. Кстати, для поиска датасетов рекомендую Kaggle. Может и участие в соревновании зайдет как проект?

очень хотела бы в автоэнкодеры уйти. но не уверена, не утопит ли это меня.
от чего же утопит?) если сделать, скажем, сравнительное исследование вариационных автоэнкодеров и GAN'ов в задаче генерации изображений - может наоборот все будут пищать от восторга. Во всяком случае, когда я учила (2 года назад) у нас все хлопали в ладоши, когда кто-то упоминал GAN'ы (и, возвращаясь мысли выше - Kaggle, нас очень поощряли там участвовать).
Конкретно по сравненю VAE и GAN'ов я глубоко не копала, поэтому пределы их возможностей не знаю, но это может быть интересно, а может быть там уже все исследовано вдоль и поперек и все дрочат на GANы.

У вас к чему больше душа лежит? Изображения? Речь? Перенос стилей и прочая экзотика?