📱 Подписаться на канал

Китайский DeepSeek разработан Яндексом?

Китайский DeepSeek разработан Яндексом?Краткий ответ: Нет конечно) Вот в этом посте при обвале рынков США я писал:👉 я лично до конца не знаю как модели работают, но мне представляется что ее могли скопировать/спереть, а то что в 1700 раз выгоднее обучить - не верится, а если так, то надо объединиться ради человечества и в 1700 раз быстрее создать полноценный ИИ который решит все текущие проблемы людей)За эту неделю DeepSeek привлек к себе большое внимание, и люди начали его копать/ковырять, кто то даже что-то там взломал/нашел незащищенную базу данных со всеми чатами (тут) и еще вот такие ответы при тестах "Я Яндекс/Я ChatGPT", выясняется, судя по всему DeepSeek взяли несколько популярных моделей, и “слепили/обучили“ свою модель, с усовершенствованным reasoning’ом, благодаря которому модель лучше рассуждаетДистиляция знаний (Knowledge Distillation) в искусственном интеллекте – это методика, позволяющая «перенести» знания от более крупной (и, как правило, более точной, но при этом более ресурсоёмкой) нейронной сети, называемой учителем (teacher), к более компактной и быстрой нейронной сети, называемой учеником(student). Основная идея состоит в том, чтобы использовать выходные данные (предсказания) или внутренние представления крупной модели для обучения меньшей модели, не теряя при этом ключевые особенности, которые позволяют достигать высокой точности.Поэтому иногда бывают такие забавные ответы от DeepSeek, что он Яндекс, или ChatGPT. Просто (как я понял) в нем намешаны данные от разных моделей)В любом случае для нас - конечных пользователей это хорошо, что началась некая гонка AI, будут конкурировать друг с другом и улучшать свои сервисы, а то кроме ChatGPT никого особо не слышно было)#ai | @andreyposnov