Ну, вот мы и дошли аж до пятого дня! А самое классное, что пишу этот текст я в ночь на 16-е, так что… можно сказать, что догнали. Успех и победа.
Я постараюсь перейти к формату коротких сообщений. Всё же чаще, но короче должно быть лучше, а то кто простыни-то читает?
Ладно, назад к теме, за последние дни я познакомился с базовыми инструментами анализа данных, получил обещание, что мне отвалят много зелёных карточек (информационная систем острова всё ещё еле живая, фиксят её, судя по всему, НА ЖИВУЮ, так что зелёные карточки приходят не всем) — награду за активность. Это положительные очки и возможность закрывать свои штрафы.
Самый сложный и неприятный момент за последние дни (14-15) был посвящён тому, что 15-го утром должна была быть защита проектов, которые группы делали (так или иначе) эти 5 дней. Проблема лишь в том, что, как обычно, вечером 14го я остался один из группы… А задача была уже серьёзная — подготовить презентацию, рассказывающую, как же мы решаем нашу задачу. С результатом наших наработок…
Безумное количество времени у меня ушло на поиск репрезентативного датасета, ведь для работы с имиджем вуза лучше всего подходит анализ сообщений в сми и соцсетях…
Короткий итог: базу я вовремя не нашёл. Сервисы, которые могли бы выдать такое дело требовали регистрации и оплаты, а бесплатные… позволяли выгружать жалкие 100 строк. Ну что это вообще такое? В итоге мне помогли найти датасет с отзывами на курсы в курсере, но там особо не разгуляешься, так что мне предложили обучить модель, определяющую тональность текста, а потом показать, как это всё здорово. За это я и взялся.
Задача оказалась много сложнее, чем хотелось бы, ведь большинство примеров и утилит были рассчитаны на работу с питоном, а я до сих пор с ним не разбирался, ведь это было мне не нужно, а учить его за ночь, да ещё и не спав до этого почти… план так себе.
Если коротко, то утром я +/- доковырял код на С#, однако он дописывался до самой защиты проекта. Скажу сразу — там ещё надо работать, он очень дичёво предсказывал в тестовом режиме, хотя в самотестировании выдавал невероятно крутую точность в 90%+.
На итоговой защите выступать решил я, т.к. остальные несли слишком уж херню не по делу, но тут что поделать, там не было IT-шников. Никогда не любил выступать перед большой публикой незнакомцев, особенно, когда презентацию видишь в первый раз за 5 минут до выхода «к доске», но что поделать.
Для тех, кому вот совсем нечего делать, есть ссылка на выступление:
Считаю опыт участия в этой лаборатории (а это был последний день!) крайне приятным и успешным. Буду пробовать разные штуки из своих конспектов на практике в вузе, как только вернусь обратно в Томск.