Клуб CDO


Гео и язык канала: Россия, Русский
Категория: Технологии


Сообщество профессионалов в области работы с данными и искуственным интеллектом


Гео и язык канала
Россия, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Небольшая статья на тему конфиденциальных вычислений. На мой взгляд не самая глубокая, но дает общее представление о том, что такое "защищенные анклавы", так что тем, кто хочет разобраться в этой теме - могу рекомендовать

https://habr.com/ru/companies/brave/articles/717916/


Дайджест статей

Боты для «раздевания» фотографий и другие кейсы, как ИИ меняет интернет-порно
https://habr.com/ru/articles/777612/

Внутренние данные: топливо успеха в банковской индустрии, или Тайны загрузки данных, формирующих будущее инноваций
https://habr.com/ru/companies/alfa/articles/776744/

FineBI: Обработка данных для начинающих пользователей
https://habr.com/ru/companies/glowbyte/articles/776648/

Нетипичные сценарии использования BI-системы (Apache Superset)
https://habr.com/ru/companies/rostelecom/articles/772118/

The Importance of Master Data Management (MDM)
https://dzone.com/articles/the-importance-of-master-data-management-mdm?utm_source=pocket_saves

Integration of Big Data in Data Management
https://dzone.com/articles/integration-of-big-data-in-data-management?utm_source=pocket_saves

Implementing Data Lakes in Data Management
https://dzone.com/articles/implementing-data-lakes-in-data-management?utm_source=pocket_saves

The Importance of Master Data Management (MDM)
https://dzone.com/articles/the-importance-of-master-data-management-mdm?utm_source=pocket_saves


Пара слайдов вам для презентаций и интересная книжка


Сегодня редакция тут в полном составе


и это только май 2023


Видео недоступно для предпросмотра
Смотреть в Telegram
Не могу не поздравить нашу команду #sberdevices с получением премии TAdviser “ВКС с Искусственным интеллектом» с продуктом SberJazz :)


Прогноз погоды остается одной из самых сложных задач с момента возникновения метеорологии как науки (а не как наблюдения за высотой полета ласточек). И все знают (по сообщениям той же МЧС), что до сих пор человечество не может похвастаться тем, что сумело разработать точную мат модель предсказания движения воздушных потоков. Метеорологические службы всегда обладали одними мощными суперкомпьютерами, оперировали огромными объемами данных о наблюдениях физической природы и конечно разработка такой модели активно ведется.

В этой статье рассказывается об институте ECMWF который был создан в 1975 году. В Центре работает около 350 сотрудников, в основном назначенных из разных стран-участниц и сотрудничающих государств. На протяжении почти 50 лет учёные развивали и совершенствовали свою модель, которая сейчас является самой лучшей в мире. Год за годом, шаг за шагом они внедряли обновления и допиливали свою модель до идеального состояния.

Качество прогнозов стабильно росло на протяжении десятков лет. Например, в 1986 году модель ECMWF прогнозировала поле давления на 3-е суток с точностью 90%. Сейчас этот показатель 98-99%.

Некоторые интересные подробности и детали этой модели описываются в статье ниже: https://habr.com/ru/articles/775236/


Понравилось интервью Давида Яна на канале NEW HR

Много интересных мыслей про работу с командой, мотивацию, удержание, управление, стили неформального лидерства и тд. Конечно, не обошлось тут без Yva.ai, но в целом и про это решение было интересно послушать.

Особенно, кстати, на что я обратил внимание: Yva.ai это система, которая позволяет управлять оттоком сотрудников. "Отток" сотрудников в целом очень похож на тему управления оттоком клиентов, да и вообще, постоянно замечаю, что маркетинг и HR очень похоже в плане механик автоматизации по привлечению, конверсии и удержанию. Так что, Давид много говорит (и довольно грамотно) не о самом выявлении того, что сотрудник собрался менять работу, а следующем шаге - а что надо сделать, что бы он изменил свое это стремление.

Это важно, ведь решения, которые позволяют идентифицировать то, что клиент или сотрудник вас скоро покинет - бесполезны без правильно предпринятых действий по удержанию. А вот в них то и самая магия :) Выявить на основе анализа поведенческих данных то, что сотрудник уходит - не так и сложно, а вот понять почему - намного сложнее.

https://www.youtube.com/watch?v=w-XIlBr57Ys&list=WL&index=8


Репост из: vlad kooklev — ai & startups
📺 Как устроены изнутри языковые модели

Я постоянно пишу про сложные технические темы. Я осознанно не вдаваюсь в детали, но зато посты получаются более насыщенными моими инсайтами. В то же время, я с большим уважением отношусь к людям, которые могут простыми словами объяснять, как устроены сложные вещи.

Именно такой контент регулярно выпускает Andrey Karpathy — один из главных людей в OpenAI и в прошлом директор AI-направления в Tesla. Несколько дней назад у него вышло видео «Intro to Large Language Models». Там он за час рассказывает из каких основных компонентов состоят системы, как ChatGPT. Если слышали термины «инференс», «файн-тюнинг», «галлюцинации модели», но не понимаете их до конца, то рекомендую к просмотру. Видео набрало за эти дни уже пол миллиона просмотров.

Если пока нет времени, чтобы посмотреть видео целиком, то Леша из канала «Ночной Писаревский» сделал хорошую выжимку на 5 минут на VC. Этого хватит, чтобы получить первичную картину и начать лучше ориентироваться в теме.


Хотел отдельный пост написать про этот материал, но во всех каналах уже более быстрые и менее занятые коллеги публикуют его, так что просто сделаю forward 🙂


Довольно интересный канал ведут ребята из Tinkoff:
- Youtube: https://www.youtube.com/@CodeofArchitecture
- Telegramm: https://t.me/its_reading_club

Они записывают подкасты где обсуждают профессиональный нон-фикшен. Разбирают довольно интересные книги по инженерии ПО, контента пока не очень много, но выглядит многообещающе


Друзья, небольшое обновление бота "Игорь"😹️️

- поставил самую свежую модель gpt-3.5-turbo-1106 (ChatGPT4 все еще довольно дорогая, но если кому то прям надо - напишите, я могу отдельно ее включить)
- закрутил гайки по монетизации, теперь если вас нет в списке пользователей, которые хотя бы раз делали donation, то бот будет отвечать раз в 5 минут, если есть - то как обычно без ограничений.

Пока статистика монетизации хромает, из всех пользователей, кто использует Игоря, донаты делают не больше 5% (хотя бы раз), так что продолжаем не забывать поддерживать проект: https://t.me/cdo_club/1562


Дайджест статей

ID vs. Multimodal Recommender System: Perspective on Transfer Learning
https://dzone.com/articles/id-vs-multimodal-recommender-system-perspective-on

Разоблачаем Эффект Даннинга-Крюгера. Статистический артефакт, пример автокорреляции
https://habr.com/ru/articles/776444/

В ногу со временем: введение в многомерный анализ и OLAP-технологии
https://habr.com/ru/articles/775042/

Clickhouse, Grafana и 3000 графиков. Как построить систему быстрых дашбордов
https://habr.com/ru/companies/ozontech/articles/774712/

Искусственный интеллект в Google: от старых проектов к новым достижениям
https://habr.com/ru/companies/ru_mts/articles/775232/

Модельный риск: как увеличить эффективность работы ML моделей в большой компании
https://habr.com/ru/companies/X5Tech/articles/775424/

Обучение ИИ на синтетических данных: исследователи из MIT меняют правила игры с системой StableRep
https://habr.com/ru/companies/bothub/articles/776130/

Вредные советы: как самостоятельно внедрить DWH и потратить впустую деньги и время
https://habr.com/ru/articles/776258/

Что эффективнее — усложнять модель или увеличивать количество данных?
https://habr.com/ru/articles/776332/

Data Validation To Improve the Data Quality
https://dzone.com/articles/data-validation-to-improve-data-quality?utm_source=pocket_saves


Минутка занимательной истории

Это Pixar Image Computer 1986 года. Это было одно из первых устройств, разработанных Pixar, тогда ещё подразделением Lucasfilm. Этот компьютер был предназначен для обработки изображений высокой сложности, особенно для рендеринга графики высокого разрешения в медицинских исследованиях, геофизике и кинопроизводстве.

Pixar Image Computer использовал технологию, которая была очень продвинутой для своего времени. Он мог обрабатывать изображения с высоким разрешением, что было большим прорывом в области компьютерной графики. Однако из-за высокой цены и сложности в использовании, он не получил широкого распространения в промышленности и был коммерчески неуспешен.

Pixar впоследствии перешла от производства оборудования к созданию анимационных фильмов, что в конечном итоге привело к её огромному успеху в этой области.

Такой вот pivot




Из твиттера сюда перешарить не могу, но новость интересная. Кто знает подробности?


Репост из: Малоизвестное интересное
Что за «потенциально страшный прорыв» совершили в OpenAI.
Секретный «проект Q*» создания «богоподобного ИИ».

Сегодняшний вал сенсационных заголовков, типа «OpenAI совершила прорыв в области искусственного интеллекта до увольнения Альтмана», «Исследователи OpenAI предупредили совет директоров о прорыве в области искусственного интеллекта перед отстранением генерального директора» и т.п., - для читателей моего канала не вовсе новости. Ибо об этом я написал еще 4 дня назад.
Но от этого вала новостей, публикуемых сегодня большинством мировых СМИ, уже нельзя отмахнуться, как от моего скромного поста. И это означает, что СМО (специальная медийная операция), внешне выглядевшая, как низкопробное, скандальное ТВ-шоу, вовсе таковой не была. Ибо имела под собой более чем веские основания – забрезжил революционный прорыв на пути к тому, что известный эксперт по ИИ Ян Хогарт назвал «богоподобным ИИ».
Из чего следовала необходимость срочных кардинальных действий и для Сама Альтмана, и для Microsoft:
• Microsoft – чтобы не оказаться с носом, уже вложив в OpenAI $13 млрд (дело в том, что по имеющемуся соглашению, все действующие договоренности между Microsoft и OpenAI остаются в силе, лишь до момента, когда совет директоров OpenAI решит, что их разработки вплотную подошли к созданию сильного ИИ (AGI). И с этого момента все договоренности могут быть пересмотрены).
• Сэму – чтобы успеть сорвать банк в игре, которую он еще 7 лет назад описал так:
«Скорее всего, ИИ приведет к концу света, но до того появятся великие компании».

И Сэму, и Microsoft требовалось одно и то же - немедленный перехват управления направлением разработок OpenAI в свои руки. И сделать это можно было, лишь освободившись от решающего влияния в совете директоров OpenAI сторонников «осторожного создания AGI на благо всему человечеству». Что и было сделано.

Однако, точного ответа, что за прорыв совершили исследователи OpenAI, мы пока не имеем.
Все утечки из среды разработчиков OpenAI упоминают некий «секретный «проект Q*» [1] по радикальному повышению производительности лингвоботов на основе LLM.

Известно, что эта работа велась, как минимум, по трем направлениям:
1. Совершенствование RAG (Retrieval Augmented Generation) – сначала поиск релевантной информации во внешней базе в целях формирования из нее оптимального промпта, и лишь затем обращение к системе за ответом). Кое-какие результаты такого совершенствования были недавно показаны на OpenAI DevDAy. И они впечатляют [2].
2. Комбинация Q-обучения и алгоритма A*.
Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например, в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.
Q-обучение — это метод обучения без учителя в области искусственного интеллекта, который используется для обучения программ принимать решения. Представьте, что вы учите робота находить выход из лабиринта. Вместо того чтобы прямо говорить ему, куда идти, вы оцениваете его действия, давая баллы за хорошие шаги и снимая за плохие. Со временем робот учится выбирать пути, приводящие к большему количеству баллов. Это и есть Q-обучение — метод, помогающий программам самостоятельно учиться на своем опыте.
3. Поиск траектории токена по дереву Монте-Карло в стиле AlphaGo. Это особенно имеет смысл в таких областях, как программирование и математика, где есть простой способ определить правильность (что может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач)
#ИИ #AGI
1 https://disk.yandex.ru/i/9zzI_STuNTJ6kA
2 https://habrastorage.org/r/w1560/getpro/habr/upload_files/f9a/994/b06/f9a994b060188b43ba61061270213bca.png


Интересное развитие событий. Правда это все или нет, хз, но этот сериал становится все интереснее.


Друзья,

29 ноября, в ближайшую среду, в Москве пройдет серьезный форум по данным - DaTalks 2023. Судя по насыщенной программе, организаторы обеспечат максимально прикладной контент по всем основным блока - DWH, шины данных, нормализация данных, BI.
Очень много ярких спикеров - X5 Group, Faberlic, Рив Гош, Home Bank, ТМК, Axenix и многие другие.

Темы:
- Почему дата-центричная архитектура необходима именно сейчас
- Показания к перестройке работы с данными
- Тренды и перспективы в области DWH, MDM, BI
- Лучшие практики и рецепты от вендоров и интеграторов
- Опыт импортозамещения data-решений — особенности, риски, ноу-хау

Программа и форма регистрации - https://datalks2023.ru/?utm_source=TG&utm_medium=cdoclub&utm_campaign=29_11_23_DaTalks


И все таки редакция канала не может пройти мимо такого комментария к твиту Наделы о назначении Альтмана :)))

Показано 20 последних публикаций.