daring, ambitious, supercilious
В понедельник к нам в гости зашел Ден Вандеркем, друг Джона и инженер Гугла.
В итоге я попросила его помочь мне установить два пакета для моего проекта по пропаганде. Он все с подозрением спрашивал, Sophie, what is Brat?, но dependencies все-таки разруливал.
Самый смешной момент был в том, когда он заявил, что я так себе компьютер сломаю, you gotta put a condom on it. Что-то про setting up the environments, чтобы эти самые dependecies не конфликтовали. Эммммм.
Но что меня поразило - это его работа с моим компьютером. Сжатый и угловатый Ден обладает по-настоящему элегантными движениями, когда дело касается клавиатуры. Это было невероятно.
Когда-то, может, и я стану примерно такой же.
Но вот меня интересует не быть совсем как Ден. У него пятнадцать лет опыта в Гугле и он на том уровне, когда он просто не знает, что с собой делать. Виртуоз компьютеров, у него нет background-а в других областях и поэтому он ограничен выполнять сложнейшие проекты... других. И он все в поиске своих проектов - то напишет приложение для айфона, которое с помощью машинного обучения промаркирует каждую улицу Сан Франциско и Нью-Йорка старыми фотографиями, то займется какими-то трекерами, то лекции дает.
Но он абсолютно гениален. Ден офигенный.
Эээ, а почему так? Ты говоришь, словно компьютеры это обязательно для чего-то другого. Но тебе же не приходило в голову, что виртуоз в алгебре обречен прикладывать свои знания для чужих проектов. Он вполне может заниматься алгеброй ради алгебры, а тут все тоже самое и даже лучше, потому что есть ПО ради ПО (или программистов), более того, имхо делать такое более круто чем "для пользоваталей" (и думаю большинство согласно со мной в этой оценке).
Будучи экспертом по машинному обучению (а тем более в гугле), Ден вполне может разрабатывать сам tensorflow например и кучу других инструментов и отсутсвие знаний в скажем бизнесе/социологии/медицине, которые были бы ему нужны, чтобы самому успешно делать свои проекты для "пользователей"
Прости, пожалуйста, если прозвучало жестко!
Эээ, все ок, у тебя же там два смайла - надо очень постараться, чтобы увидеть в этом что-то жесткое) Вот если бы была в конце точка, то наверное показалось бы жестким, но это все равно не повод обижаться
Вообще если я не отвечаю, то я или забыл что был такой тред ну точнее я сначала откладываю, а потом забываю, или не знаю что сказать)
Вот это как это было столь внезапно, что я не нашелся что сказать)
Но видимо он интересуется именно использованием машинного обучения, а для такого наверное и правда нужны проекты для другой отрасли) Хотя все-таки странно, потому что можно же поидее использовать его для вещей "в себе". Буквально вчера слушал доклад, человек использовал машинное обучение, чтобы находить пропуски вызовов функций. Правда имхо вышло не очень, все это чисто для использования конкретной библиотеки не маштабируется и не имеет никакого практического смысла.
Только вот МО... я сильно удивлюсь, если там математики не завались, а можно разрулить все без такой вот подготовки.
(Если оно так, то я пошла))) )
Я теперь таки понимаю, о чем это. Если есть интерес, могу более-менее осознанно пообщаться об этом вопросе
Вот я поискал и тоже не нашел)
Возможно стоило прокомментировать твой последний пост вообще на эту тему, а не тут продолжать. Но пожалуй мне и та есть что спросить)
Вот кстати я думаю касательно блекбоксовости, что основная проблема с ней, что где-то все равно надо остановиться. А поиск этого места может занять время, . т.е. вот ты решила (условно ВНЕЗАПНО), что хочешь понимать как работают на самом деле алгоритмы эти. А могла подумать, что нехорошо, что сам питон немного черный ящик. Или попробовав реализовать самостоятельно аналогичный кол, задаться вопросом почему он намного медленнее работает.
Если ты перескочишь на разработку математического ПО, то оба вопроса могут встать острее, т.к. будут "ближе". Но подобно тому, как занимаясь собственно этой разработкой тебе придется отойти от применения машинного обучения для анализа политики, так и они уведут тебя от собственно математической составляющей. И если не смириться в какой-то момент что "вот это то, чем я хочу заниматься, а те смежные области до конца не понимаю, ну и ладно", то этот путь бесконечен)
Ну, алгоритмы не сложные, по сути. Сложность заключается в том, чтобы закодить их так, чтобы работали в полиномиальное время. И, насколько я понимаю, они кодятся в сайтоне, который позволяет добраться до уровня С.
Да? Интересно. Я думал там все алгоритмы кодиться чисто на си, а для питона только обертка с удобным интерфейсом.
Ну собственно аременные оценки для распространнех алгоритмов известны, обычно если их и ускоряют, то или не в асимптотическом смысле. (то есть при n < 10000 скажем стало в 2-3 раза быстрее, но на бесконечности оценка та же), или просто улучшаются немного асимптотику, но не сильно. Ну типо было O(n^k) а стало O(n^m), где 1 < m < k
Но реализовывать это все действительно не тривиально, не зря олимиады по спортивному программированию устраивают)
Ага, ты никогда не слышала? icpc.baylor.edu/
Или вот площадка, где тусуются спортсмены и устраивают локальные соревнования) codeforces.com/
Вряд ли это ценится в академ.среде. Плюс для дата сайенса есть Каггл.
Ну так академическая среда разная бывает, не только дата сайенс, цениться это конечно скорее гуглом и подобными, но думаю что тем кто занимаются всякой комбинаторной/дискретной оптимизацией и подобным опыт таких соревнований может быть очень полезен)
Ну так цены не сами результаты, а скорее навыки) А они просто зачастую все-таки коррелируют с результатами, крепкий середничек уже и легко пройдет интервью по алгоритмам, которые любят некоторые топовые компании и для соответсвующих научных областей тоже гарантирован приличный запас знаний.
А так этих соревнований и есть парочка, по сути
По математике слышала, а вот по компьютерам нет.