Love. Death. Transformers.


Channel's geo and language: Russia, Russian


❤️☠️🤗
Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Ожидается опыт ресерча от года, в противном случае не поймёте мемов тут

Related channels  |  Similar channels

Channel's geo and language
Russia, Russian
Statistics
Posts filter


Попробовал новую модель от meta, прям хорошая


Очевидно нет
Читать что это - тут


Flux1.1 очень хорош

3.5k 0 21 15 55

Собственно, у двух ребят первая статья и сразу на EMNLP


Напомните а что с EMU


Forward from: Vikhr models
Vikhr paper едет на Workshop emnlp!

А из-за того что все авторы очень русские никому не выдали визу)))

4.2k 0 32 11 103

Ребята из JetBrains тоже активно ищут Mlщиков всех видов вне рф, писать сюда @Voiaking


Umojo

ML инженеров для CV. И Тим лида для команды CV, вне рф

@Tanya_tepli


touch the grass is all you need


Я был до последнего уверен что blueberry это dalle4 лол


Forward from: CV Time
Blueberry оказалась Flux 1.1. Pro

Помните загадочную Blueberry, которая лидировала на text2image-арене? На ECCV выяснилось, что это была Flux 1.1 Pro от Black Forest Labs — об этом сообщил сооснователь компании Алекс Зауэр. Более того, по его словам, сегодня нас ждёт ещё один анонс, связанный с этой моделью.

CV Time

#YaECCV

4.5k 0 16 26 18

Учить что либо на более 10 нодах сложно. Уже начинает влиять топология кластера, падает MFU, отваливаются ноды и так далее, на лету выкидывать ноды из обучения сложно. Скорость интернета внутри датацентра одинаковая только в теории.
В целом любое массивное обучение на сотнях и тысячах нод это очень сложно, затратно и инженерно.

В первые вижу в паблике подробный блогпост про оптимизацию network level для обучения на 4к h100.

Блогпост


Forward from: Vikhr models
Натурализация выходов llm

С помощью
DPO можно учить LLM генерировать LLM более натуральные тексты, для этого берем текст, нарезаем на куски, суммаризируем, затем генерируем "любой сеткой" кандидатов. Учим DPO где хороший текст это оригинал, а плохой это то что сетка родила.

Собственно у нас в Vikhr Models есть трек с Roleplay+Interpretability поэтому мы сгенерировали такой датасет на основе habr+picabuu+ficbook.

Ну и забыли заанонсить🫠

А вчера увидел пост у Ильи что ребята в комьюнити проделали аналогичную работу над книжками!


На основе книжек
Наш датасет на основе более разнообразного датамикса




How-To-Succeed-At-MrBeast-Production.pdf
1.8Mb
Feels like a best management book ever



6.2k 0 170 5 189

Forward from: DLStories
Помните, писала, что у нас с коллегами приняли статью на COLM, но конференция в США и ни у кого из нас нет виз? Так вот, конференция 7-9 октября в Филадельфии, и мы все еще в поисках человека, который мог бы туда поехать и презентовать нашу статью😢

В том посте я писала, что нужно будет постоять рядом с нашим постером. Но теперь все немного сложнее: наша статья попала на oral (spotlight). То есть, нужно будет выйти зачитать доклад по нашей статье на 12 минут🌝 Текст и презентация доклада будут готовы.

Поэтому если вдруг вы или ваши коллеги едут на COLM, и готовы с этим нам помочь, напишите, пожалуйста, Лаиде. Вы очень-очень нам поможете!
(Я помню, что под предыдущим постом были люди, готовые помочь. Спасибо вам большое, что тогда откликнулись! Если вы все еще готовы помочь, будем очень рады)


Чёт какой то пиздец творится в Abby, всех уволили одним днём. Пока не понятно, по цвету паспорта или просто всю разработку.

Ребята в революте нанимают:
- Computer Vision
- Natural Language Processing
- Engineering
- Product Owners
pavel.nesterov@revolut.com


Positive Technologies нанимают ML инженеров:

- NLP
- Classic ML
- LLM (prompt/rag/agents)

@tanyasmirom


Dubformer также ищет людей

https://dubformer.notion.site/Dubformer-10a125bf243380a2abaacf5810abef5d

Lifepay ищут инженера

https://hh.ru/vacancy/108000952

@s_davvvv @flashnik

ArenaData ищет Лида на code generation

@abalagaev CV сюда

Если у вы имеетее дс вакансии, пишите в личку/ кидайте под пост и добавлю в сообщение

6.7k 1 134 42 129

Forward from: Derp Learning


зарабатывать на разводе гоев на инвестиции, говорить что вы строите agi


Forward from: ебãные идеи для трейдинга
зарабатывать на разводе бабок на комиссии, говорить что вы ИТ компания



7.5k 1 113 7 187
20 last posts shown.