HuggingChat, a little cousin franco-américain de ChatGPT, a de quoi surprendre. Developed by Hugging Face, le chatbot a particularité de se baser sur un modèle open source. A small revolution in the domain.

GPT-3, ChatGPT et, plus récemment, GPT-4… Depuis 2022, le nom d’OpenAI résonne in all the têtes des passionnés du secteur. Pourtant, l’entreprise de San Francisco n’est pas la seule à developer de grands modèles de langage (LLM). Fondée en 2016, Hugging Face tends to rival avec les géants du secteur. Sa particularité: proposer des models ouverts, accessible à tous.

HuggingChat, c’est quoi ?

Launched in grande pompe au cours du mois d’avril 2023, HuggingChat is an assistant virtual similaire à ChatGPT. The general rule is that you write texts in plus styles, that you create code, that you write content in an analyzer of your context or that you help with the tasks of plus complexes.

The interface is simple, similar to the version published by ChatGPT. Par défaut, les conversations avec l’IA sont partagées avec les developpeurs. An option that is the best possible to refuse and it is worth it in the parameters. Comme all model d’intelligence artificielle, HuggingChat est susceptible d’halluciner en inventory of fausses informations (or des citations).

HuggingChat is a generic term for text types. // Source : Numerama

The bot is available via the Hugging Face API. « Certains ont dit que les API fermées étaient en train de gagner… mais nous n’abandonnerons jamais le combat pour l’IA open source », s’est félicité Julien Chaumond, l’un des co-fondateurs de l’entreprise sur LinkedIn.

Comment functionne HuggingChat ?

For functionner, HuggingChat s’appuie actuellement sur le modèle oasst-sft-6-llama-30b-xor d’OpenAssistant (oui, c’est un nom compliqué). Dans le but de democratiser la recherche sur l’IA au plus grand nombre, les modèles utilisés par le bot sont totalement open source. The project OpenAssistant is developed and maintained par LAIONa German association but non lucrative dont l’objectif affiché est de « mettre à la disposition du grand public des modèles d’apprentissage automatique à grande échelle, des ensembles de données et le code correspondant. »

A model performant in future.  // Source : Mohamed Hassan / Pxhere
A model performant in future. // source : Mohamed Hassan / Pxhere

LAION œuvre également pour réduire l’empreinte énergétique des modèles d’IA pour faire face aux enjeux du réchauffement climatique sans pour autant se passer de la technologie. The organization est entièrement financée par des dons et des subsidies liées à la research publique.

Techniquement, OpenAssistant a été entraîné sur des données textuelles de haute qualité, annotées par des humains pour une meilleure compréhension du contexte. An étude des preferences a révélé que « The responses from the OpenAssistant are comparable to the preferences of GPT-3.5-turbo (ChatGPT) with a value of 48.3% and 51.7% respectively », notent les developers du modele dans un article scientific you 14 april.

Qui se cache derriere HuggingChat ?

HuggingChat is a franco-américaine initiative. C’est en realité la startup Hugging Face, une veritable communauté autour de l’IA. The plateforme fournit des tools complete pour developer et utiliser des models. Elle héberge actuellement, au 4 may 2023, plus de 120 000 models, 20 000 ensembles de données and 50 000 applications de demonstration nommées Spaces. A veritable mine d’or pour les chercheurs.

« Aucune entreprise, y compris les Tech Titans, ne sera en mesure de ‘résoudre l’IA’ à elle seule – le seul moyen d’y parvenir est de partager les connaissances et les resources dans le cadre d’une approche centrée sur la communauté », assure la start-up sur son depot GitHub.

Hugging Face la startup qui monte.  // Source : Pavel Danilyuk / Pexels
Hugging Face depends on the open source from IA. // source : Pavel Danilyuk / Pexels

Bien que les trois fondateurs, Clément Delangue, Julien Chaumond and Thomas Wolf, soient français, Hugging Face est basée aux États-Unis. A new illustration you desormais bien connu phenomene du « brain drain. »

Pourquoi l’arrivée d’une IA open source est une bonne nouvelle ?

Plus qu’un simple délire de nerd, l’open source constitue une necessité pour la communauté scientifique. « Je crois que nous avons besoin d’alternatives open-source à ChatGPT pour plus de transparency, d’inclusivité, de responsabilité et de distribution du pouvoir », explique de son côté Clement Delangue sur Twitter.

Pour les chercheurs, use a IA plus transparent permet d’obtenir des résultats plus precise dans le cadre d’une étude. Afin de comprendre le comportement du système dans certaines situations, il est bon de connaître le code et les données d’entraînement du modèle (pendant sa phase d’apprentissage).

Dans le cas de ChatGPT, des chercheurs de l’Université de Californie à Berkeley (Kent Chang, Mackenzie Cramer, Sandeep Soni, et David Bamman) ont demonstrated the predominance of certain genres littéraires au be de la « memoire » de l’IA. Un bias negatif susceptible notamment d’affecter les résultats d’une étude menée avec ces outils d’intelligences artificielles.

Enfin l’opacité relative des modèles propriétaires fait craindre le risque d’une fuite d’informations confidentielles (secret industrial notamment) in the case of a professional use. Sans parler des risques pour la vie privée lors d’un usage personnel.


Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous subscribing to Numerama on Google News.

California18

Welcome to California18, your number one source for Breaking News from the World. We’re dedicated to giving you the very best of News.

Leave a Reply