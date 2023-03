À l’origine, OpenAI avait embrassé le movement de l’open source pour ses travaux sur l’intelligence artificielle. Mais ça, c’était avant.

The artificial intelligence is soluble in the open source ? Pas aux yeux de la société américaine OpenAI, à l’origine de l’agent conversationnel (chatbot) ChatGPT et des modèles de langage GPT-3 et GPT-4. Plus exactement, ce n’est plus le cas aujourd’hui. À ses debuts, la society avait embrassé l’idée d’une recherche ouverte. Huit ans plus tard, elle juge maintenant avoir fait une erreur.

C’est l’aveu fait à The Verge d’Ilya Sutskever, l’un des cofondateurs d’OpenAI et le scientifique en chef du project. « Nous nous sommes trompés. Nous nous sommes carrément trompés », at-il lâché. Cela fait d’ailleurs plusieurs années qu’OpenAI a free sur l’open source. In 2019, the company also operates a pivot plus general in its internal organization.

« Nous nous sommes trompés. Nous nous sommes carrément trompés » Ilya Sutskever

The open source in IA is not reasonable for OpenAI

Pourquoi cette trahison des engagements initiaux ? Pour Ilya Sutskever, it’s a question of responsability and ethics: it’s possible to let it go in free acces des outils extremely performants dans les mains dont ne qui. Cela pourrait meme desservir l’humanité dans son ensemble — d’autant que les IA actuelles sont déjà en mesure de bousculer certaines professions.

« Si vous pensez, comme nous, qu’à un moment donné, l’IA — l’IA générale — sera extreme, incroyablement puissante, alors il n’est tout simplement pas logique d’ouvrir le code source. C’est une mauvaise idée… Je m’attends à ce que, dans quelques années, il devienne évident pour all le monde qu’il n’est pas judicieux de mettre l’IA en libre accès », at-il argué.

Une IA generale, also called IA forte, est une formula pour décrire a machine capable of reproducing les capacités cognitives humaines de façon générale, sur des problèmes variés qu’on lui soumettrait. Elle se distinguish des IA faibles, qui sont incapables d’aller au-delà de la specialité pour laquelle elles ont été conçues. Les IA generales n’existent pas encore.

L’intelligence artificielle generale, ou forte, serait capable de reproduire des capacités cognitives humaines. // Source : Canva

Lors de sa naissance en 2015, OpenAI affiliate un interest mark pour l’ouverture. « Les chercheurs seront fortement encouragés à publier leurs travaux, que ce soit sous forme d’articles, de billets de blog ou de code, et nos brevets (s’il y en a) seront partagés avec le monde entier », était-il proclamé. Elle avait opté pour une structure de société de recherche à but not lucrative.

Quatre ans plus tard, OpenAI prenait un virage différent. Elle a ouvert une filiale à but lucrative in 2019, pour soutenir le financement coûteux de la research in IA in the long term. Elle s’est également rapprochée de Microsoft, une entreprise privée, qui a investi la même année pas moins d’un billion de dollars. Par la suite, leurs liens se sont encore resserrés (dix billions in 2023).

2020 a mark a tournant plus significant encore, lorsque Microsoft a signé avec OpenAI « for the exclusive license of the GPT-3 language model ». GPT-3 is a model of language (c’est-à-dire is a statistical model of distribution of motifs and structuring of phrases) which is preceded by GPT-3.5, and a version is attached. ChatGPT uses GPT-3.5.

GPT n’est pas encore capable d’imiter les capacités d’un cerveau humain, mais l’outil d’OpenAI s’améliore. // Source : Numerama

An example de cette prize de distance avec le libre accès est le Choose OpenAI from the publisher and API — in clair, an interface de programming d’application pour se connecter à son infrastructure. Cet abandon de la mouvance open source a été denoncé par Elon Musk, un autre pioneer de la society. Le nom d’OpenAI devait à ce titre refléter cet engagement pour l’ouverture.

Lorsque OpenAI a explicite le choice d’une API, three arguments available été mis en avant :

the commercialization of the equipment carried out by the company de financer ses activities in the research, the security and the orientations in the IA ;

les models sous-jacents à l’API « sont très volumineux, leur development et leur déploiement required a great expertise et leur exploitation est très coûteuse ». Seules les grandes enterprises sont capable de suivre. The API offers a contraire option for the participants, the startups and the PME;

le model de l’API donne à OpenAI la maîtrise de ce qui se passe avec son modèle et de corriger des abus et des dérives qui apparaîtraient au fur et à mesure de l’utilisation.

« Comme il est difficile de prévoir les cas d’utilisation en aval de nos modèlesdeveloppait l’entreprise dans son billet d’announcement, il semble intrinsèquement plus sûr de les diffuser via a API et d’en élargir l’accès au fil du temps, plutôt que de diffuser un modèle open source dont l’accès ne peut être modifié s’il s’avère qu’il a des applications nuisibles. »

Des raisons plus prosaïques contre l’open source

Le flou qu’entretient OpenAI autour de ses technologies se reflète avec GPT-4, ce que denoncent des spécialistes en IA. Certes, l’entreprise a partage a general publication ainsi qu’un paper plus technique and de la documentation. Trop peu pour savoir comment fonctionne vraiment ce modèle, néanmoins. Les memes critiques ciblaient les systèmes précédents come GPT-3.5.

D’autres raisons plus prosaïques peuvent néanmoins exister, au-delà des craintes autour d’une IA forte, dont l’émergence fait l’objet de débats parfois intenses chez la communauté scientifique. Il peut s’agir d’une stratégie pour éviter de thunder à des concurrents des billes pour s’améliorer. OpenAI ne voudrait pas qu’un rival copie ses procédés. La bataille promet d’être dantesque.

Microsoft, which invests enormously in OpenAI, is retrospective in a course on the IA face on other sources of technology, like Google and Facebook, and people from Apple and Amazon. Cette compétition se reflète also dans des decisions préoccupantes, comme l’affaiblissement des équipes charged, chez Microsoft, des questions éthiques.

Le rapport technique, d’ailleurs, le dit noir sur blanc : au regard des enjeux et de l’concurrence, le rapport assume ne rien dire sur l’architecture (y compris la taille du modèle), le matériel, le calcul d’entraînement , la construction de l’ensemble de données, la method d’entrainement ou d’other elements similar.

Other raison qui peut s’ajouter aux deux autres: la responsabilité juridique de la société pourrait être engaged selon la nature des données qui ont servi à entraîner ses outils. In this case the IA is capable of generating images, using photos and designing protégés for the author est de nature à ouvrir des procès. Also in cas d’utilization of certain texts.

