🆘 OpenAI в кризисе данных?Сотрудники OpenAI, тестирующие новую модель искусственного интеллекта «Orion», сообщили, что, хотя ее общая производительность выше, чем у существующих моделей OpenAI.
Темпы улучшения намного ниже, чем в предыдущих обновлениях (например, скачок улучшения от GPT-3 к GPT-4), и она может не быть стабильно лучше в определенных областях, таких как кодирование и выполнение сложных задач на рассуждение.
Проблема (во всей отрасли) заключается в нехватке новых, высококачественных и разнообразных обучающих данных для расширения понимания модели ИИ , поэтому для решения этой проблемы OpenAI сформировала группу по разработке основ.
Команда пробует использовать синтетические данные (искусственные данные, созданные моделями ИИ) наряду с реальными данными, поскольку это может ввести новые уровни изменчивости и нюансов, улучшая способность модели обрабатывать сложные сценарии.
После обучения они также планируют использовать такие методы, как обучение с подкреплением и тонкую настройку для конкретных задач, чтобы устранить пробелы в производительности, для заполнения которых реальных и синтетических данных недостаточно.
Замедление совершенствования моделей ИИ из-за нехватки неиспользованных реальных качественных данных для обучения влияет на всю отрасль ИИ, а ограничения, связанные с нехваткой данных, вызывают обеспокоенность по поводу будущего развития ИИ и способности моделей ИИ раскрыть свой максимальный потенциал.
Поэтому многие будут следить за тем, будет ли работать подход OpenAI, заключающийся в использовании синтетических данных и методов постобучения, и продолжит ли он продвигать отрасль ИИ вперед.
https://t.me/aibizlife | #OpenAI