ТЕХНО: Яндекс про технологии


Channel's geo and language: Russia, Russian
Category: Technologies


Канал Яндекса о том, как устроен мир технологий. Разберёмся в потоке технологических новостей о нейросетях, роботах, голосовых помощниках, умном доме и не только.
Чат канала https://t.me/+488-8LyZuSM1NWRi
Boost https://t.me/techno_yandex?boost


Channel's geo and language
Russia, Russian
Statistics
Posts filter


🌨☀️❄️ Яндекс опубликовал большое исследование о том, как менялась погода в России с 1950 года. Такие исследования помогают бизнесу в долгосрочном планировании деятельности. Собрали в карточках пять впечатливших нас фактов. Увидеть больше данных и посмотреть на интерактивную инфографику можно на странице исследования.

Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке.


👩‍💻 Технодайджест недели

Одной из самых обсуждаемых техноисторий недели стало поведение чат-бота Google Gemini при генерации изображений людей. Пользователи заметили, что Gemini генерирует картинки с людьми разного пола и расы при практически любых запросах, даже если результаты получаются исторически недостоверными.

Так, пользователи публиковали скриншоты, на которых чат-бот создавал картинки темнокожих викингов, римских императоров и американских сенаторов XIX века в ответ на запросы, в которых не было уточнений про расу и цвет кожи. Кроме того, Gemini часто отказывался генерировать изображения по промптам, в которых пользователи просили нарисовать людей со светлой кожей.

Вскоре Google признала проблему и отключила возможность генерировать изображения людей. Компания пообещала доработать эту функцию и вернуть её, когда убедится, что она работает существенно лучше.

Другие новости недели, которые показались нам интересными:

Робопса ANYmal научили скакать на трёх ногах и открывать двери четвёртой. Швейцарские инженеры создали нейросетевой алгоритм управления роботом, позволяющий ему использовать одну из ног для взаимодействия с предметами. В одном из экспериментов он поднял свободной ногой рюкзак и положил его в корзину.

Apple внедрила в iMessage квантово-устойчивый алгоритм шифрования. Такие алгоритмы, предположительно, устойчивы к атакам с помощью мощных квантовых компьютеров будущего, которые будут способны быстро расшифровать данные, защищённые классическими криптографическими алгоритмами. Ранее аналогичный алгоритм внедрил мессенджер Signal.

Google выложила в открытый доступ две большие языковые модели Gemma. Их архитектура и параметры обучения аналогичны таковым у Gemini, но размер существенно меньше. Это позволяет запускать их локально на многих компьютерах, а версию 2B — даже на смартфоне. По качеству работы Gemini 7B сопоставима с Mistral 7B (правда, имеет больший размер).

Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium поддержите наш канал по ссылке.


👹💻🌐 Около полувека назад в мире технологий возникла одна из самых живучих городских легенд. Почитайте её историю.

Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium поддержите наш канал по ссылке.

27.5k 0 63 22 215

🗯 Моя волна — это система персональных рекомендаций в Яндекс Музыке, подбирающая в режиме реального времени треки, которые могут понравиться пользователю. Она ориентируется на вкусы человека (например, любимых исполнителей или жанры) и его действия — лайки, дизлайки, переключения треков, сохранения и другое.

Кстати, когда Моя волна подбирает новый трек, она учитывает не только то, как пользователи взаимодействуют с музыкой, но и «заглядывает» внутрь аудио. Специальные алгоритмы раскладывают трек на частоты, а потом превращают эти данные в вектор. У песен с похожим звучанием получаются близкие вектора, поэтому этот метод удобно использовать для рекомендаций.

Основной алгоритм Моей волны настроен на баланс между новыми для пользователя треками и треками, которые он уже слышал раньше. С помощью настройки Незнакомое можно сместить поток рекомендаций в сторону неизвестных треков и исполнителей.

Настройка Незнакомое была в Моей волне с самого начала, но теперь она обновилась. Разработчики Яндекс Музыки добавили в неё отдельный ранжирующий алгоритм. Его обучали именно для подбора новой музыки, которая с большой вероятностью понравится человеку. Алгоритм ищет подходящие треки только среди новых и чаще «рискует», добавляя непривычную для пользователя музыку.

Цель изменения была в том, чтобы сделать настройку более смелой и увеличить количество треков, которые будут нравиться пользователям. Тесты показали, что с новым алгоритмом пользователи на 20% чаще сохраняют себе в Коллекцию предложенные Моей волной треки.

Расскажите в комментариях, каких новых любимых исполнителей помогла вам найти настройка Незнакомое в Моей волне👇

Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium поддержите наш канал по ссылке.

27.4k 0 78 23 205

⭐️ Больше интересного контента про технологии

Хотим делиться с вами не только постами, но и публиковать истории. А ещё предложить уникальные реакции на посты. Чтобы открыть их, нам нужны ваши голоса. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке.

28k 0 2 7 113

Forward from: Яндекс
🔴 В ноябре прошлого года на Камчатке закончилось извержение вулкана Ключевской, которое длилось 4,5 месяца. Такие в регионе происходят регулярно.

Метеорологи из Яндекс Погоды, студенты Школы анализа данных и специалисты из Yandex Cloud разработали систему, чтобы предсказывать, в какую сторону направится облако пепла, и предупреждать о нём жителей ближайших городов.

🔴 Камчаткой система не ограничивается, использовать её можно в любом регионе. Подробнее о вулканическом огненном кольце и нашей технологии читайте на Хабре.

Подписывайтесь 🔴 @yandex


🔎 Смотрите, что случайно нашли, когда делали новый материал для ТЕХНО. В 1973 году прошёл международный конкурс на разработку графического воплощения сканируемого товарного кода. 7 апреля 1973 года американский деловой журнал Business Week опубликовал эскизы семи финалистов конкурса и назвал победителя — проект компании IBM, который начали применять с середины 1974-го и используют до сегодняшнего дня.

Подписывайтесь 👉 @techno_yandex

28.1k 0 221 21 401

Если бы история пошла по альтернативному пути, вы бы могли видеть такие символы каждый день. Как думаете, что это? Пишите свои догадки в комментариях.

Подписывайтесь 👉 @techno_yandex


📚🤖 Датасеты состоят из информации, на основе которой алгоритмы учатся распознавать объекты, находить закономерности, прогнозировать результаты и делать множество других вещей. В массив могут входить фотографии, тексты, аудио и вообще любые данные, которые можно показать машине.

Чтобы превратить данные в датасет, нужно провести их разметку, то есть присвоить каждой единице информации определённую характеристику. При разметке учитывается какой-то признак — местоположение, связь с другими объектами, принадлежность к определённой категории и так далее. Например, чтобы нейросеть научилась распознавать животных, её необходимо обучить на датасете, в котором у фотографий кошек будет подпись «кошка», у фотографий собак — подпись «собака» и так далее (вот тут можно понять, как это работает).

Датасеты создавали и до появления нейросетей: ирисы Фишера — это знаменитый набор данных, позволяющий классифицировать виды ирисов в зависимости от их размеров. Другой известный пример, уже из компьютерной эры, — база данных ImageNet. Она состоит из миллионов изображений с описаниями. Её используют для отработки технологий машинного зрения.

Чем больше датасет и чем качественнее разметка — тем более эффективным будет обучение нейросети. Сбор и разметка крупных массивов данных — это длительный и сложный процесс, поэтому разработчики часто используют готовые датасеты, имеющиеся в открытом доступе.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex


🔎🌐 Всего 30 лет назад поиск в сети выглядел совсем иначе. Рассказываем, как люди справлялись без поисковиков.

Люди вручную искали и отправляли друг другу информацию
До появления Всемирной паутины (WWW) сетями-предшественниками в основном пользовались научные и государственные учреждения — они обменивались сообщениями и передавали файлы. В 1980-х ответ на интересующий вопрос можно было получить от других пользователей сети Юзнет, а скачать интересующий файл — на FTP-сервере (но нужно было знать его адрес).

Все ссылки хранились на одном сайте
В начале 1990-х поиск в интернете ограничивался info.cern.ch — первым сайтом в истории. Владелец нового сайта отправлял ссылку создателю Всемирной паутины Тимоти Бернерсу-Ли, а тот определял её в одну из категорий каталога, где ссылку могли найти другие пользователи. Этот каталог превратился в WWW Virtual Library, первую виртуальную библиотеку ссылок.

Люди изучали каталоги сайтов, боты их наполняли
К середине 1993 года в мире существовало несколько сотен сайтов, и вместе с этим появился спрос на библиотеки страниц. В июне 1993-го такой список под названием What’s New выпустили создатели браузера Mosaic, а в августе появился гид по интернету — Global Network Navigator. В том же 1993 году Мэтью Грэй из MIT придумал бота World Wide Web Wanderer, который сканировал все сайты в интернете, наполняя базу данных Wandex.

Люди начали пользоваться поисковиками
В 1994 году студент Вашингтонского университета Брайан Пинкертон запустил WebCrawler — первую в мире поисковую систему, которая искала заданное слово по веб-страницам. Это понравилось людям, и в 1995 году появился поисковик AltaVista — он искал запросы, сформулированные на естественном языке. А в 1997-м появилась поисковая машина Яndex-Web. Она индексировала рунет, который на тот момент состоял из пяти тысяч сайтов.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex

32k 3 90 13 286

Video is unavailable for watching
Show in Telegram
👨‍💻Технодайджест недели

Главной техноновостью недели стал анонс нейросети Sora, генерирующей видео по текстовому описанию. Разработчикам из OpenAI удалось совершить прорыв в качестве генерации: многие из роликов, которые показала компания, настолько реалистичны, что отличить их от настоящих можно, только если вглядываться в детали.

Sora основана на архитектуре трансформер, но токены в ней кодируют не слова, а фрагменты кадров видео. При генерации она использует метод диффузии, создающий картинки из визуального шума. Примечательно, что OpenAI рассматривает Sora не только как инструмент для генерации видео, но и как важный шаг на пути к созданию качественной симуляции физического мира.

Пока OpenAI предоставила доступ к Sora только профессионалам в области создания визуального контента, а также специалистам по выявлению рисков и нежелательного поведения нейросетей. Анонс нейросети породил много опасений насчёт развития дипфейков, поэтому вполне вероятно, что выход Sora в общий доступ состоится нескоро.

Другие новости недели, которые показались нам интересными:

Google представила языковую модель Gemini 1.5 Pro. По качеству работы она находится на уровне Gemini 1.0 Ultra и GPT-4, но работает быстрее и расходует меньше ресурсов благодаря архитектуре MoE. А ещё модель получила контекстное окно размером в миллион токенов (у GPT-4 Turbo оно составляет 128 тысяч токенов). Это позволяет нейросети проанализировать в одном запросе всю трилогию «Властелин колец».

Nvidia выпустила приложение для локального запуска языковых моделей. В него встроены две открытые модели: Mistral и Llama 2 13B. Приложение поддерживает работу с локальными файлами и веб-страницами, например, чат-боту можно задать вопрос про содержимое документа.

OpenAI начала тестировать долгосрочную память в ChatGPT. Чат-бот будет запоминать важные факты о пользователе, чтобы учитывать их при генерации ответов. При этом данные можно удалить в настройках.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex


Forward from: Яндекс
Video is unavailable for watching
Show in Telegram
😊 Показываем пасхалки в Яндекс Станциях

В наших устройствах есть не только технологии, но и скрытые послания от разработчиков. Показываем, какие пасхалки команда умных устройств оставляет в Станциях, а главное — зачем они это делают и какой смысл заложен в каждой из них.

Подписывайтесь 🔴 @yandex

29.4k 0 284 16 497
12 last posts shown.