Pusheen Machine


Гео и язык канала: Россия, Русский
Категория: Технологии


Папка с закладками про машинное обучение, искусственный интеллект, интересные статьи, идеи из книжек и разные полезные штуки для всех интересующихся.
Чтобы отправить ваш материал - пишите админу @galperovich
https://vk.com/pusheen_machin

Связанные каналы

Гео и язык канала
Россия, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Кстати, у этого же Дэвида есть такие заметки и с других недавних ML конференций 😍

https://david-abel.github.io/notes.html

ICML 2019 (Long Beach, California, USA)
IACAP 2019 (Mexico City, Mexico)
ICLR 2019 (New Orleans, Louisiana, USA)
AAAI 2019 (Honolulu, Hawaii, USA)
ICML 2018 (Stockholm, Sweden)
AAAI 2018 (New Orleans, Louisiana, USA)


Заметки, сверстанные в LaTeX с конференции ICML-2019
https://david-abel.github.io/notes/icml_2019.pdf

Дэвид Абель, PhD студент из Брауновского университета, сделал офигенный документ об International Conference on Machine Learning, которая прошла 9 июня недалеко от Лос-Анджелеса. В основном, он делал упор на лекции о reinforcement learning, но и другие темы там тоже есть. Он даже формулы все сверстал!

Вот бы с каждой конференции были такие документы 😌


TensorFlow Hub - кладезь моделей

https://tfhub.dev/ - это большое количество натренированных моделей для разных задач. Модель включает в себя кусок TensorFlow графа с весами и может быть переиспользована для transfer learning чтобы:

- Натренировать новую модель с использованием меньшего количества данных
- Улучшить обобщающую способность модели
- Ускорить тренировку

!pip install "tensorflow_hub==0.4.0"
!pip install "tf-nightly"

import tensorflow as tf
import tensorflow_hub as hub

tf.enable_eager_execution()

module_url = "https://tfhub.dev/google/tf2-preview/nnlm-en-dim128/1"
embed = hub.KerasLayer(module_url)
embeddings = embed(["A long sentence.", "single-word","http://example.com"])
print(embeddings.shape) #(3,128)

Вот пример как переиспользовать модель для классификации изображений с новыми категориями https://www.tensorflow.org/hub/tutorials/image_retraining
GitHub проекта - https://github.com/tensorflow/hub


Давно тут ничего не было - давайте снова пообщаемся 🙂

Хочу предложить вам почитать отличный пост небезызвестного Андрея Карпатого (директор AI в Tesla, в прошлом - исследователь в OpenAI и DeepMind) - где он делится собственным рецептом тренировки нейронных сетей - https://karpathy.github.io/2019/04/25/recipe/ (но мне кажется, что эти советы подойдут и для любого data science проекта)

Кстати, у него очень крутой блог - почитайте:
https://karpathy.github.io/ (основной блог)
https://medium.com/@karpathy (недавняя попытка перейти на медиум)




Помните, этим летом проходило две крутые летних школы в Торонто: Deep Learning and Reinforcement Learning Summer School?

Дак, вот: совсем недавно выложили материалы!
По этой ссылке вы найдете все видео лекции: http://videolectures.net/DLRLsummerschool2018_toronto/
А вот тут блог пост по итогам школ: https://bit.ly/2qAvros


Дорогие читатели, сразу несколько важных новостей!

1. У нас появился сайт⚡http://pusheen-machine.com/
До этого все публиковалось в Телеграме t.me/pusheen_machine и Вконтакте vk.com/pusheen_machine
Теперь порядок публикаций такой: все обновления будут продолжать отправляться в ТГ и ВК, но если мы пишем лонгрид, то это будет жить на сайте. Там все выглядит гораздо красивее и удобнее искать.

2. У нас прибавление в авторах! Может теперь будем чаще что-то публиковать🙂 И Оля уже написала для вас первый пост - нежное введение в Reinforcement learning http://pusheen-machine.com/reinforcement-learning-an-introduction/

3. И последнее - мы приглашаем вас стать автором! Или просто поделиться с нами интересными ссылками. Лучшее опубликуем.
Если хотите делиться с миром тем, что вам интересно или дать обратную связь нам - теперь есть специальный чат команды https://t.me/joinchat/BkbvjA5WEZuDGrLewJ7aew
Пожалуйста вступайте только если:
а) Хотите стать автором и уже знаете о чем напишете
б) У вас есть ссылка на что-то крутое, но автором стать пока не хотите
в) Хотите оставить отзыв/замечание

Ну, и конечно, не забудьте прочитать новый материал :)

http://pusheen-machine.com/reinforcement-learning-an-introduction/


Кажется, организаторы вышеупомянутой школы сдались, и лекции стали просто доступны по ссылке без смс и регистрации🙂 Вот сегодняшняя лекция (3 августа), которая была в 10:00

https://www.youtube.com/watch?v=JZtRpKwk8p0


Летняя школа по deep learning на задачах анализа звука, изображений, и аудиовизуального распознавания эмоций

Летнюю школу организовывет ЦРТ - Центр речевых технологий в Петербурге со 2 по 15 августа. И набор в нее уже закрыт.

Но можно зарегестрироваться и получить ссылки на онлайн лекции!
Поэтому если кому интересно - https://mlschool.speechpro.ru/


Ian Goodfellow расскажет что-то про Adversarial Machine Learning на бесплатном вебинаре 😏

Регистрируйтесь!

24 июля, вторник
Длительность: 1 час

https://event.on24.com/eventRegistration/EventLobbyServlet?target=reg20.jsp&partnerref=twitterShareFromReg&ms=1531251848082&eventid=1633807&sessionid=1&key=8B7A8F4B65B54C35752F8A6FE23F641A®Tag=&sourcepage=register




Заставляем Jupyter автоматически подхватывать изменения в кастомных функциях, которые вы импортируете из ноутбука

Ситуация: вы из ноутбука импортируете что-то из .py файлов (модулей), например какие-то util функции и классы. Также, вы иногда эти модули редактируете и хотите, чтобы в ноутбуке после ре-ипорта автоматически подгружались изменения (ожидаемое поведение, да?)

Кажется смешным, но Jupyter не регистрирует изменения в этих файлах после того как kernel был запущен. Это довольно досадно и неудобно, в худшем случае приходится перезапускать kernel, в лучшем все время использовать магические команды в импортах или функцию reload().
Чтобы раз и навсегда решить эту проблему и забыть об этом недостатке Jupyter, можно создать и отредактировать ipython profile.

1. Создайте ipython profile и откройте его конфигурацию:

ipython profile create
nano ~/.ipython/profile_default/ipython_config.py

2. Вставьте эти строки в конец файла:

#---------------------
# Autoreload extension
#---------------------
c.InteractiveShellApp.exec_lines = []
c.InteractiveShellApp.exec_lines.append('%load_ext autoreload')
c.InteractiveShellApp.exec_lines.append('%autoreload 2')


3. Готово! После того как вы делаете изменения во внешних функциях, вам просто надо вызвать фунцию и все (даже не надо делать заново импорт).


Вести с полей - новые идеи, обсуждаемые на одной из лучших конференций по машинному обучению ICLR

В канале все притихло потому, что я была в долгом путешествии по Америке и Канаде, была на двух классных конференциях - ICLR в Ванкувере и IEEE Security & Privacy в Сан-Франциско. Теперь наконец-то вернулась домой и хочу поделиться с вами свежими пирожками - самыми интересными статьями и идеями, в этом посте речь пойдет об ICLR. Первый раз красиво сверстала пост в сервисе telegra.ph 🐼

http://telegra.ph/Novye-idei-obsuzhdaemye-na-mezhdunarodnoj-konferencii-ICLR-2018-po-mashinnomu-obucheniyu-06-02


🦄 Awesome List - это репозитории на GitHub, в которых собрано невероятное количество крутых материалов: статей, туториалов, лекций и книг. Выбрала лучшие Awesome lists по нашим любимым ML/AI:

✨ Awesome Natural Language Processing
https://github.com/keon/awesome-nlp

✨ Awesome Deep Learning
https://github.com/ChristosChristofidis/awesome-deep-learning

✨ Awesome Most Cited Deep Learning Papers
https://github.com/terryum/awesome-deep-learning-papers

✨ Awesome Data Science
https://github.com/bulutyazilim/awesome-datascience

✨ Awesome Machine Learning & Deep Learning Tutorials
https://github.com/ujjwalkarn/Machine-Learning-Tutorials

✨ Awesome R
https://github.com/qinwf/awesome-R

✨ A curated list of data science blogs
https://github.com/rushter/data-science-blogs

✨ Awesome Artificial Intelligence
https://github.com/owainlewis/awesome-artificial-intelligence

✨ Awesome Machine Learning for Cyber Security
https://github.com/jivoi/awesome-ml-for-cybersecurity

✨ Awesome Python
https://github.com/vinta/awesome-python

✨ А это - список всех awesome списков по любым темам 🙂
https://github.com/sindresorhus/awesome


Минитест на знание Machine Learning

Недавно я публиковала ссылку на классный блог профессора ВМК МГУ Александра Дъяконова.
В одном из своих постов он пригласил читателей пройти минитест на знание машинного обучения, который "довольно неплохо отфильтровывает совсем слабых соискателей" потому что "сейчас у каждого в резюме написано, что он знает Python, прошёл несколько курсов на курсере, но 80% не знают, что такое логистическая регрессия и как инвертировать список на Python".

Не хотите попробовать пройти? 🙂 В конце будут правильные ответы и статистика по остальным участникам.

Ссылка на минитест: https://docs.google.com/forms/d/e/1FAIpQLScFNuftP6MHVMhGHKpCPJu9jWphSiCTBkP16U21tLMFdDQHFQ/viewform

Ссылка на пост: https://alexanderdyakonov.wordpress.com/2017/07/19/%D0%BC%D0%B8%D0%BD%D0%B8%D1%82%D0%B5%D1%81%D1%82-%D0%BD%D0%B0-%D0%B7%D0%BD%D0%B0%D0%BD%D0%B8%D0%B5-ml-%D0%B8-dm/


Классный сайт, который надо знать - distill.pub

Проект Distill ставит своей целью популяризовать новый формат научных статей в сфере машинного обучения. Идея в том, что статьи должны быть понятными, привлекательными, графически динамичными и яркими (а не скучными и трудолюбиво сверстанными в LaTex).

Distill - это не только очередной блог, это официально зарегистрированный журнал с ревью и всеми станадртными процедурами по проверке качества.

Красиво оформленная, динамичная и хорошо написанная статья помогает быстрее и глубже понять тему исследования, а также делает работу прозрачной и четкой. Такие статьи невероятно приятно и интересно читать, только попробуйте!

Больше всего впечатляют люди, стоящие за проектом Distill:
Разработчики и исследователи из Google Brain, Deep Mind, YC, Tesla, NYT, а также Yoshua Bengio и Ian Goodfellow.

Сейчас там не очень много статей, но каждая - настоящее произведение искусства https://distill.pub




TensorFlow выпустил тулбокс для probabilistic reasoning

TensorFlow Probability позволяет интегрировать вероятностный подход с deep learning, делать inference с помощью градиентных методов и автоматического дифференциирования. А это значит - строить генеративные вероятностные модели, измерять uncertainty и добавлять prior к моделям на больших данных.
В TensorFlow используется вероятностный язык Edward https://github.com/blei-lab/edward

Блог пост: https://medium.com/tensorflow/introducing-tensorflow-probability-dca4c304e245
GitHub: https://github.com/tensorflow/probability




Я ненавижу Spark

Поэтому хочу опубликовать тут список хороших ресурсов, которые, помогут мне (и возможно вам) его узнать лучше, чем сейчас, и я не буду рвать на голове волосы, когда джоба падает.
Первые две книги уже скачала - осталось только прочитать.

💥 Learning Spark: Lightning-Fast Big Data Analysis
http://shop.oreilly.com/product/0636920028512.do

💥 Advanced Analytics with Spark: Patterns for Learning from Data at Scale
https://www.amazon.com/Advanced-Analytics-Spark-Patterns-Learning/dp/1491912766

💥 Spark in a day
https://www.amazon.com/Spark-Ultimate-Learning-Development-Beginners-ebook/dp/B013GQP702/httpwwwtuto0a-20

💥 Apache Spark Tutorial
https://www.tutorialspoint.com/apache_spark/index.htm

💥 Apache Spark Scala Tutorial
https://github.com/deanwampler/spark-scala-tutorial

💥 Python For Data Science Cheat Sheet (by DataCamp)
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/PySpark_Cheat_Sheet_Python.pdf

💥 Spark documentation - там много других полезных ссылок на видео/книги/лекции
https://spark.apache.org/documentation.html

Показано 20 последних публикаций.

827

подписчиков
Статистика канала