Les chimistes cherchent à communiquer avec les molécules, et leurs secrets
Les chimistes ont toujours étaient fan d'analogie, quand il faut parler d'atome à un enfant, nous parlons du système planétaire pour lui faire imaginer que ce qu'il connait comme étant grand représente un autre système mais microscopique cette fois.
Suivant cette logique, d'analogie en analogie, c'est en analysant le langage statistique des moteurs de recherche que les États-Unis et la Pologne essayent de montrer l’intérêt d'un visualisation de la chimie par des mots et des phrases pour obtenir de nouveaux chemins rétrosynthétique !
Qu'est-ce que la rétrosynthèse ? En chimie quand nous avons affaire a une molécule, imaginons, d'origine végétale qui possède plein d'avantage à titre médicamenteux, nous sommes généralement obligé de l'extraire de la plante en question, hors il est possible que la molécule soit en très petite quantité présente dans la plante, ce qui rend sont utilisation mondiale compliquée. C'est pourquoi les Ingénieurs et Chercheurs chimiste cherchent des voies de rétrosynthèse, à partir d'une molécule fini, pour arriver à un protocole permettant de la créer efficacement, avec un faible cout.
"Le langage computationnel moderne est la reconnaissance des formes.", précise Bartosz Grzybowski (De la Northwestern University of United-States). Cela signifie que la logique algébrique des langages utilisé par les moteurs de recherchent se base sur un motif Et ce motif peut, bien entendu, être remplacé. D'une phrase à l'atome. Cette logique computationnel a été intégré par Grzybowksi dans l'outil Chematica. Un logiciel permettant la découverte de nouvelle voies de synthèse.
Durant le temps de création de Chematica, Grzybowski prend connaissance des progrès algorithmique de ces moteurs de recherche.
Les linguistes (Grzybowski pense, en écrivant son article, qu'il est le seul chimiste de cet branche) créer des dictionnaires de chaînes communes, de série de lettres et même de mots qui sont ensuite classés par fréquence. En imitant ce procédé, les chimistes ont compilé un dictionnaire de fragment commun de différente molécule. Quand leurs analyses, basées essentiellement sur les groupements fonctionnels (vous savez : Alcool, Amine, Aldéhyde…), furent appliquées, ils se rendirent rapidement compte que les règles du jeux étaient bien plus complexe que la formation Anglaise des phrases et de mots. Grzybow observe que l'analogie qu'il fait, de la linguistique vers la chimie, suit ce propos : La langue n'est pas dût à l'alphabet, mais à un schéma répétitif de mots.
Finalement, comment doit-on parler chimiste ?
Bizarrement, en examinant les fragments structurelles possibles pour Chemitica, l'équipe de Grzybowski est finalement arrivé à un résultat proche de l'anglais. A la fin de cet examen, l'équipe applique une technique statistique appelé "term frequency–inverse document frequency" (TF-IDF: terme de fréquence-inverse document de fréquence) permettant de trouver le début de la synthèse (le précurseur). Le TF-IDF est une technique visant à calculer les fréquences d'apparitions des mots dans une phrase, comparé à la fréquence du mot dans la langue. Cela permet de retrouver les mots qui contiennent le plus d'informations.
Grâce au type de Search-Engine comme Google, il possible de défragmenter une molécule pour analyser ses parties de manières dissocier, et donc d'en tirer les plus simple fractions que l'on pourra "Assembler"
Coucou à tous, j'aimerais beaucoup vos avis sur ce sujet, merci pour votre lecture et attention.