Зарабатывайте на рекламе

В вашем телеграм-канале от 2000 подписчиков

Зарабатывайте на рекламе

в вашем телеграм-канале с Рекламной сетью Яндекса

Статистика Избранное

Derp Learning

@derplearning

Гео и язык канала: Россия, Русский

Категория: Софт и приложения

Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Связанные каналы | Похожие каналы

Гео и язык канала

Россия, Русский

Категория

Софт и приложения

Статистика

Избранное

Фильтр публикаций

Скрывать удаленные

Скрывать репосты

Derp Learning

26 Jul, 18:27

Репост из: Оправдания для заказчика

00:23

В Таиланде нашли кафе, в котором идеально обслуживают удалёнщиков. По пятницам им меняют кофе на пиво.

Выезжаем.

1.3k 0 44 10 41

Derp Learning

26 Jul, 18:26

Репост из: Fast Food Memes / ffmemes

🪺 Fast Food Memes

1.3k 0 14 18

Слили список видео, на которых тренировали Runway GEN-3.

Спойлер: конечно же, там куча пиратского контента. Также выкачивали красивые блогерскик видео с Ютуба.

Хз, правда кого в 2024-м можно этим удивить.

404media ссылается на бывшего сотрудника, который слил целый документ со ссылками на избранные плейлисты и каналы в ютубе для парсинга видео в датасет. Кроме того, документ содержит ссылки на сайты с пиратскими фильмами.

Примечательно, что такие сливы обычно опираются на "чьи-то слова" и притянутые за уши примеры похожих генераций, а тут прям целый документ с конкретными ссылками и тегами.

Смешно, что до обращения 404media runway спокойно генерала видосы с именами Ютуберов в промпте, а сейчас говорят, отказывается работать, лол.

Интересно, чем этот скандал закончится. Я не удивлюсь если и OpebAI тркнились на видео из Ютуба, и поэтому сейчас они особенно боятся давать доступ к SORA (вы ещё помните, что такая была?).

Источник
Документ

@ai_newz

1.1k 0 9 19

Derp Learning

25 Jul, 13:18

Stretching Each Dollar: Diffusion Training from Scratch on
a Micro-Budget

Демократизация обучения text2image трансформеров во все поля!

Чюваки из Sony AI и University of California упоролись и сократили косты на обучение в 14 раз по сравнению с текущим SOTA-подходом и aж в 118 раз по сравнению с затратами на обучение StableDiffusion 2.1

Для сравнения:
их подход - $1890, 60 8xH100- часов
текущий SOTA - $28000, 18000 A100-часов
SD2.1 - 200000 A100-часов

Сделали они это просто потренив не на а100, а на h100 с помощью маскировки 75% патчей при обучении.

FID, конечно, немного притянут. Если уж два дня тренили, чего еще два дня не потренили, все равно фора огромная.

В целом тренд на демократизацию опенсорсного ИИ мне по душе, теперь и GPU-poor посоны (8xH100) смогут ворваться в мир диплерненга! Ура товарищи!

paper

1.9k 1 30 3 31

Derp Learning

24 Jul, 09:21

Репост из: эйай ньюз

00:25

Llama 3.1 405B, квантизированная до 4 бит, запущенная на двух макбуках (128 гиг оперативки у каждого). Возможно это с помощью exo - тулы, позволяющей запускать модельку распределённо на нескольких девайсов. Поддерживаются практически любые GPU, телефоны, планшеты, макбуки и почти всё о чём можно подумать.

Запустить ламу на домашнем кластере

@ai_newz

1.4k 0 41 5 27

Derp Learning

24 Jul, 08:03

Design and Control of a Bipedal Robotic Character

Пейпер года конечно (по уровню милоты)

Paper

2.2k 0 23 3 18

Derp Learning

20 Jul, 23:07

Репост из: Denis Sexy IT 🤖

01:07

Видео недоступно для предпросмотра

Смотреть в Telegram

Новая порция звезд с собой из прошлого

Сделано в Kling

2.9k 0 35 5 24

Derp Learning

20 Jul, 15:52

Отец знакомого работает в Microsoft. Сегодня срочно вызвали на совещание. Вернулся поздно и ничего не объяснил. Сказал лишь собирать всю технику и бежать в магазин за драйверами на две недели. Сейчас едем куда-то далеко за город. Не знаю что происходит, но мне кажется началось...

4.1k 0 54 10 104

Derp Learning

19 Jul, 20:00

Репост из: Denis Sexy IT 🤖

Собрал вам мудборд на сегодня

2.4k 0 85 5 63

Derp Learning

17 Jul, 23:40

Помню мне как-то предлагали вакансию "водитель фуры-рефрижератора по вашему резюме 3д-визуализатор"

3.3k 0 7 9 30

Derp Learning

17 Jul, 23:40

Репост из: Dev Meme

Be honest, did you gave it a second of thought?

3k 0 25 10 34

Derp Learning

17 Jul, 23:38

Репост из: эйай ньюз

Пока OpenAI всё тянет с релизом обещанной модельки, гугл потихоньку разворачивает киллер-фичи от Gemini, в том числе Vids.

Vids — это новая тулза от гугл, которая должна помось создавать видосы на скорую руку. Из функционала:
- Генерация скрипта
- Текста для видео
- Подбор стоковых видео
- Генерация видео (наверное через Veo)
- Подбор фоновой музыки
- Генерация текста для озвучки
- Генерация самой озвучки

И всё это в один шаблон.

Короче, полноценный агент для создания дешёвых промо роликов. (Ну а что, Спилберг тоже не с Голливуда начинал)

Чтобы проверить, есть ли у вас доступ к функциям Workspace Labs, откройте документ в Google Docs. Слева [у меня была справа] найдите раздел "Help me write".

Я в гугл доках у себя вижу значок "Ask Gemini", а вы? Но Vids у меня пока не доступно, пишут что раскатили это только на маленькую группу «доверенных юзеров».

Подробности
Про Vids

@ai_newz

2k 0 20 9

Derp Learning

17 Jul, 16:06

Репост из: Нейросети и Блендер

01:00

Kling генерации

⭐️ Приятное видео воссоединения одного и того же человека в молодости и в старости.

🧠 Все это сделано в Kling видеонейронке. Предварительно сшив две фотографии из разного возраста звезд в одну картинку и похоже подав с промптом на обнимание. 🐈‍⬛Доступ к видеонейронке только с валидным китайским номером.

☺️ Хотя с таким же подходом можно подать видео в Dream machine

1.9k 0 68 5 28

Derp Learning

16 Jul, 09:09

Репост из: CGIT_Vines

00:36

Всегда работающий приём — взять что-то очень новое и смешать со старым, или лучше с очень старым.

Например, взять модную шмотку, крашеные волосы, пирсинг, татухи и смешать с чтением книг, экспертностью в вине и слушаньем музыки на виниле или, ладно, кассетах.

Или делать поиски в латентном пространстве с помощью MIDI-контроллера в реальном времени.

Технологии будут совсем неотличимы от магии, если замешать всё это на химические элементы, колбы и пипетки, я полагаю.

Красота крутится на SDXL Turbo и тулките для интерактивных выставок Lunar Tools

2.7k 0 73 1 29

Derp Learning

15 Jul, 23:30

Репост из: эйай ньюз

MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases

Юзать LLM хотят все, но инференс в облаке стоит конских денег. Но есть простое решение - давайте юзеры будут запускать LLM у себя, а не в облаке. Однако не стоит забывать – большинство пользователей интернета владеют лишь телефоном. Оперативной памяти там не так уж и много - у iPhone это 6 гигов, у большинства андроид флагманов до 12, так что нужно оптимизировать параметры, но и не забывать про перформанс. Авторам пейпера удалось заметно улучшить качество инференса на телефонах, без потерь в перформансе.

Как это вышло?

➖ Авторы выяснили, что масштабирование модели вглубь при таком же количестве параметров работает лучше чем при масштабировании модели вширь. Таким образом модель на 125 миллионов параметров имеет 30 слоёв (у GPT-2, Bert и вообще всего в такой весовой категории обычно 12).
➖ Традиционный для "эффективных" моделей шеринг входного и выходного слоя эмбеддингов.
➖ Завезли Group Query Attention, который раньше в таких моделях не использовался.
➖ Убедились что все слои влезают в кэш телефонов, потому что оперативка значительно медленнее.

Самая интересная часть - layer sharing, так что её разберём поподробнее. Идея в том, чтобы использовать один и тот же слой несколько раз, и таким образом улучшить перформанс. Попробовали несколько стратегий:

➖ Повторять слои незамедлительно - то есть слой компьютит что-то, а потом его вывод кормится в него же.
➖ Повторять все слои в том же порядке - по сути моделька запускается два раза на одном и том же инпуте.
➖ Сначала считать слои в обычном порядке, а потом задом наперёд.

Лучше всех показал себя второй способ, но выбрали первый, потому что он заметно быстрее работает (не нужно грузить слой в кэш несколько раз).

В итоге вышло хорошо так улучшить результаты, без раздутия количества параметров или времени выполнения модели. Итоговая модель выдаёт более чем 50 токенов в секунду на обычном телефоне. Статья февральская, но код выложили только сейчас. Весов нет.

Пейпер
Код

@ai_newz

2.1k 0 37 16

Derp Learning

15 Jul, 10:16

00:43

gpu.cpp - a lightweight library that makes portable GPU compute with C++ simple

Тем временем парни из answer.ai (ex fast.ai) упоролись и выкатили gpu-agnostic фреймворк на WebGPU для С++.
Теперь один и тот же код можно крутить на всем, где есть Vulkan, Metal, или DirectX.
При этом тащить 100500гб CUDA для hello world больше не надо.
/ Ну и маководы снова в деле! :D

git
x-уит
answer.ai

@derplearning

3.2k 0 76 4 38

Derp Learning

15 Jul, 10:04

00:07

WestWorld intensifies, kurwa!

Ну что, зловещая долина, посоны? Анатомически корректные аниматронные руки от поляков из clonerobotics

by CloneRobotics

3k 1 37 1 31

Derp Learning

14 Jul, 19:25

Репост из: Sickipedia

In the age of AI, dating a model is not a brag anymore

#wordplay
@Sickipedia

3.1k 0 10 29

Derp Learning

14 Jul, 17:49

Репост из: CGIT_Vines

00:23

На случай, если вы вдруг искали возможность сделать липсинг для видео или фото (для сгенерированных тоже подойдет).

Можете попробовать этот тутор для ComfuUI через LivePortait.

Линки, где качать и как устанавливать, есть в описании к видосу.

Тут

3.2k 0 171 2 50

Derp Learning

13 Jul, 10:10

На этом видео PoV Джо Байдена, когда он покидает сцену.

3.8k 0 25 63

Показано 20 последних публикаций.

11 910

подписчиков

Статистика канала

Язык сайта

Зарабатывайте на рекламе

Зарабатывайте на рекламе

Derp Learning

Гео и язык канала

Категория

11 910

Популярное в канале