Spark in me

@snakers4 Нравится 0

All this - lost like tears in rain
Data science, ML, a bit of philosophy and math. No bs or ads
Our website
- http://spark-in.me
Our chat
- https://t.me/joinchat/Bv9tjkH9JHbxiV5hr91a0w
DS courses review
- http://goo.gl/5VGU5A
- https://goo.gl/YzVUKf
Гео и язык канала
Россия, Русский
Категория
Технологии


Написать автору
Гео канала
Россия
Язык канала
Русский
Категория
Технологии
Добавлен в индекс
09.05.2017 23:31
реклама
Биржа рекламы в Telegram №1
+10 554 заказов в системе за месяц +493 новых каналов
Рекламная биржа Telegram-ботов!
Каталог ботов Telega.in для покупки и продажи рекламы
TGStat Bot
Бот для получения статистики каналов не выходя из Telegram
2 455
подписчиков
~862
охват 1 публикации
~1.1k
дневной охват
~2
постов / день
35.1%
ERR %
5.96
индекс цитирования
Репосты и упоминания канала
19 упоминаний канала
31 упоминаний публикаций
63 репостов
H+ Shit
Data Science by ODS.ai
Data Science by ODS.ai
Трансгуманист
Transhumanism_in_our_hearts
Accelerando
Accelerando
Accelerando
Data Science by ODS.ai
Just links
Neural Networks Engineering
Блог Шмакова
Accelerando
Блог Шмакова
Just links
Artificial Intelligence for all
Just links
Data Science by ODS.ai
Data Science by ODS.ai
Just links
Data Science by ODS.ai
Data Science by ODS.ai
Data Science by ODS.ai
Нейронач
Generative Anton
Just links
Нейронач
Physics Blues
Нейронач
Just links
Just links
Just links
Админим с Буквой
Нейронач
Нейронач
RE:post
Нейронач
Just links
Нейронач
Нейронач
Нейронач
Каналы, которые цитирует @snakers4
partially unsupervised
Silero API news
Silero API news
Oh My Py
Silero API news
Silero API news
Silero API news
Silero API news
Silero API news
Silero API news
Silero API news
Silero API news
Hardwareluxx Russia
Silero API news
Silero API news
Silero API news
gonzo-обзоры ML статей
gonzo-обзоры ML статей
gonzo-обзоры ML статей
gonzo-обзоры ML статей
gonzo-обзоры ML статей
Silero API news
Silero API news
Silero API news
Silero API news
Profunctor Jobs
NVIDIA Inception
Data Science by ODS.ai
Profunctor Jobs
Data Science by ODS.ai
DL in NLP
Data Kitchen
Админим с Буквой
Админим с Буквой
DL in NLP
DL in NLP
Just links
Hacker News
Data Science by ODS.ai
Silero API news
Silero API news
Silero API news
Silero API news
Silero API news
Последние публикации
Удалённые
С упоминаниями
Репосты
Spark in me 19 Apr, 12:27
I personally also have promoted rclone here and I am a user of spaces by DO for smaller archives, which works just fine except for the steep pricing.

As for BackBlaze their pricing is nice, but I have considered them for really large backups ... and just buying hard-drives is also an option. Long-term buying drives is probably 2-3x cheaper (just did a quick back-of-the-envelope calculation, given that your NAS is cheap).

It depends on your use-case =)

PS
Updated second link
Читать полностью
Spark in me 19 Apr, 12:23
Репост из: partially unsupervised
На выходных продуктивно прокрастинировал: не желая убирать в квартире, решил прибраться в компьютерах - разгрести завалы файлов, почистить ~/data, что-то забэкапить и так далее.

Хотелось сложить сотни гигабайт некритичных файлов (датасеты, не самые важные бэкапы и т.д.) так, чтобы это было просто (sync ~/data /awesome_storage) и дешево.

Первая мысль была про S3, но как-то это слишком "ентерпрайзно" для такой банальной задачи, да и априори не очень дешево ($0.023-0.025/Gb в зависимости от региона + куча подозрительных примечаний). Следующим вариантом был Digital Ocean Spaces, который в целом неплох и дает 250 Gb хранилища и 1Tb трафика за 5 баксов (дальше $0.02/Gb и $0.01/Gb соответственно), т.е. по деньгам ушел недалеко - довольно ожидаемо, все-таки это уже большая и с недавних пор публичная компания. Туда же идет Vultr (я использую их для ssh-туннелирования), который копирует Digital Ocean почти во всем, в т.ч. в прайсинге.

Приятной находкой стал BackBlaze. У этих ребят два продукта - backup решение (plug and play для нетехнарей) и S3-like хранилище с ценами сильно ниже ($0.005/Gb хранение, те же $0.01/Gb скачивание). Пользоваться легко, есть два CLI API - одно мимикрирует под S3, другое свое и чуть попроще (b2 sync origin source 🚀). Прям сейчас я туда заливаю всякое барахло с неидеальной скоростью в районе 5 Mbit/s, но кажется, что проблема скорее в моем исходящем канале.

Наконец, я наткнулся на Rclone. Это open source обертка над 50+ хранилищами, от своего FTP или SFTP до сервисов типа Dropbox и Google Drive. Вышеупомянутые S3, DO, Vultr и B2 тоже поддерживаются. Для более важных бэкапов можно, например, сделать синхронизацию между провайдерами в одну команду. Благодаря Rclone, мой терабайтный Яндекс.Диск (Яндекс дарит бывшим сотрудникам) теперь не пустует, а вовсю наполняется бэкапами.
Читать полностью
Spark in me 16 Apr, 18:49
Spark in me 13 Apr, 10:15
Периодически закапываюсь и делаю очередной обзор рынка embedded устройств для ComputerVision. Сейчас триггернул OAK, на который недели две назад я делал обзор. И вот, очередная статья на Хабр - https://habr.com/ru/company/recognitor/blog/551552/
Spark in me 12 Apr, 20:19
Репост из: Silero API news
Silero VAD Update

- Added a mini VAD (100k params as opposed to micro with 10k) for 8 kHz and 16 kHz;
- Added adaptive post-processing (no need for thresholds), examples coming soon;
- Micro is also available for 8k and 16k;

https://github.com/snakers4/silero-vad
Spark in me 12 Apr, 20:19
Репост из: Silero API news
A Streaming Interface for Silero Models EE

We
have created a gRPC-based streaming interface for our EE models based on silero-vad.

Not sure if we are going to make any of this public, but writing an interface that adds value (as opposed to just having it) is difficult.

Key features:

- Unlike Google we do not rescore full results at the end of utterance / sentence => all results are kind of "final";
- Therefore "early" partial responses are a separate feature (i.e. 2 seconds after the start of utterance);
- Automatic handling of speech that is too long (i.e. 7 seconds or longer) - we have some hacks ensuring we do not cut words in the middle;
- Threading and multiprocessing;
- We had to create fast / efficient versions of silero-vad (10k or 100k params) to be included in the gRPC server;
- The service also proxies VAD responses, which may be useful downstream;

Hopefully, since real people do not speak at the same time, this would increase the hardware utilization efficiency 2x compared to a plain HTTP interface in case of phone calls.

In future we will also be calculating the sizings of our system using the streaming interface, i.e. how many real conversation each given sizing can really handle.

An educated guess - if we can handle 20 queries per second or 10 queries per 500ms with ~40 RTC, I suppose that would mean about 40 conversations.
Читать полностью
Spark in me 12 Apr, 07:30
Spark in me 10 Apr, 07:53
Spark in me 8 Apr, 10:24
Yet Another Sane Blog (RU)

Actually set of blogs / telegram channels / info materials, but whatever:

- https://antonz.ru/

Also an author of now mostly silent @ohmypy

Too much emphasis on human-friendly design and some roots of snake-oil salesmanship (i.e. @dangry), but nevertheless SNR is much better than average.

I myself even dabbled in this a bit, but got quickly disenchanted by frontend development and design.

#no_bs
Читать полностью
Spark in me 8 Apr, 08:55
Anyone tried the new MADGRAD optimizer - https://github.com/facebookresearch/madgrad?
Опрос
  • No tangible improvement on real tasks
  • Works better than SGD / ADAM out-of-the-box
  • Can be made better with tuning
  • Have not tried yet
  • What are optimizers?
116 голосов
Spark in me 7 Apr, 15:45
Репост из: Silero API news
Our TTS working on Windows 10 - an example made by the community members
Spark in me 7 Apr, 15:45
sentence separation sucks, but it can be improved
Spark in me 6 Apr, 17:49
Spark in me 6 Apr, 15:44
Finally Proper GPU Support in Compose!

It happened finally (some time ago, I just checked now)!

Now this obsolete runtime: nvidia syntax can be replaced with this more versatile syntax:

deploy:
resources:
reservations:
devices:
- driver: nvidia
device_ids: ['0']
capabilities: [gpu]


This together with CUDA_VISIBLE_DEVICES gives you full control of your GPU environment within compose.

https://docs.docker.com/compose/gpu-support/

#deep_learning
Читать полностью
Spark in me 5 Apr, 09:17
Репост из: Silero API news
New features for TTS?
Опрос
  • R&D how to train voices on 3-5 hours instead of 15+ => add more voices
  • More languages / more voices (plz comment)
  • Pitch and speed control
  • Word intonation control
  • Emotions (phrase-level)
  • Automatic stress, i.e. кошка => к+ошка
  • Celebrity / character voices (plz comment)
  • Speed up 1-thread performance
  • Other (plz comment)
100 голосов
Spark in me 3 Apr, 12:06
Spark in me 3 Apr, 11:56
ML собеседование не в Яндекс: делаем нормально

Yesterday there was a resonant click-bait article about hiring practices in Yandex.

I decided to crystallize my own constructive experiences in contrast to that post based on our article last year (Russian):

- https://habr.com/ru/post/550500/

A small guilty pleasure, sometimes I should post click-bait as well!

#off_topic
Читать полностью
Spark in me 2 Apr, 08:02
Let's broadly choose a topic (if there are any experts willing to talk or worthy topic to pursue, please comment) and then narrow it down afterwards. Also some randomness may be fun, because other people may join in
Опрос
  • Hardware
  • Deep Learning Software
  • VC / finance / investments
  • Startup management
  • Deep Learning in general
  • Cats
  • New product ideas
  • Computer games (i.e. new Doom)
  • Our TTS release
  • Your idea in the comments
117 голосов
Spark in me 2 Apr, 07:57
Desired duration
Опрос
  • 5-10m
  • 10-20m
  • 20-30m
  • 30-60m
  • 60m+
  • Not interested
105 голосов
Spark in me 2 Apr, 07:57
Which language?
Опрос
  • Not interested
  • English
  • Russian
133 голосов