Archives de la catégorie 1. Généralités

Qu’est ce que l’information ?

Introduction

information-100Si nous nous intéressons à la nature même de l’information, il s’avère utile de prendre en compte à la fois ses aspects physiques et ses aspects sémantiques. Il est nécessaire d’observer conjointement ces deux éléments pour tenter de comprendre le fonctionnement de cet étrange et familier objet d’étude. 

  1. Les aspects physiques décrivent l’émission sous forme de signaux, la nature des messages et des supports, l’encodage de l’information, la propagation dans le temps et dans l’espace, la réception de l’information et son traitement par le récepteur. 
  2. Les aspects sémantiques décrivent le cadre dans lequel ces informations prennent sens. L’information ne se transforme en communication que dans un contexte particulier, dans un environnement spécial marqué par des limites qui  définissent un système.  

Plutôt que d’aborder ces deux sujets de manière classiquement analytique, le choix est fait de les regarder ensemble. C’est l’approche systémique qui est retenue. Nous nous intéressons à la fois au message et au système dans lequel il est échangé, à l’information et à la communication. Précisons quelque peu la notion de système : un exemple pourrait être une entreprise. Les éléments du système sont alors les employés. L’information est ce que les membres de l’entreprise échangent via différents canaux pour que le système prospère. Selon les théories de Darwin, le système s’adapte à son environnement ou bien il disparaît pour des raisons internes ou externes. L’objet de ce texte est donc de tenter de mettre en évidence les grandes catégories d’informations et de systèmes dans lesquels les informations prennent un sens. Des systèmes s’opposent couramment à des antisystèmes. Les relations entre ces deux entités sont également riches d’enseignement. Tout antisystème qui s’exprime majoritairement se transforme en système. Le changement apporte à l’ensemble système-antisystème un avantage adaptatif qui favorise la diversité. Mais ce qui semble le plus intéressant dans les systèmes est que ceux-ci disposent de la capacité de changer de manière interne, parfois de manière remarquablement rapide, souvent avec difficulté. Et de tenter de dégager quelques propriétés invariables des informations d’une part, et des systèmes dans lesquels ils circulent.

Quelques liens

Sur Wikipédia : Information, Communication, Approche systémique, UberisationIntelligence ambiante

Système Antisystème Systémique
 systeme  antisysteme  systemique

La théorie de Shannon

Shannon définit en 1948 dans « A mathematical Theory of Communication » la nature physique de l’information. Son étude prend place dans le cadre des aspects théoriques et techniques de l’information médiée. Il s’agit d’optimiser le fonctionnement du téléphone, de la radio, de la télévision et des machines à calculer. Shannon définit à cette occasion une unité pour l’information électrique et électronique : le bit. Un schéma général de la transmission de l’information est proposé. Un émetteur encode un message d’information et le transmet à un récepteur via un signal qui transite par un canal. Le récepteur procède au décodage du message. La transmission de l’information est réalisée en présence d’un bruit susceptible d’affecter le signal et la capacité du message à être perçu. En considérant que le message lui-même est un système, Shannon en calcule l’entropie et fournit ainsi une méthode de physique statistique qui permet d’optimiser l’encodage des signaux électriques transitant par les canaux. Nous supposerons que la figure 1 s’avère générale et possible à appliquer à tout type d’information, que celle-ci soit électrique, chimique, sonore ou visuelle, quelque soit le système.

shannon-model

Diagramme schématique d’un système de communication général

Six différents types d’information sont alors distingués dans ce billet théorique. Les systèmes dans lesquels ces informations sont échangées sont marqués en bleu :

DNA Analysis.

Analyse de l’ADN

1/ L’information génétique / cellule, individu, groupe, population, espèce, biosphère : La vie de l’ensemble des êtres de la planète dépend de l’information génétique inscrite dans des gènes, des chromosomes et des génomes. L’ADN et l’ARN constituent les supports de l’information génétique communs à l’ensemble des êtres vivants, présents dans chaque cellule. Des processus génétiques et épigénétiques jouent un rôle majeur dans le développement, l’homéostasie et l’adaptation des individus, des groupes et des espèces à leur environnement. Le fonctionnement des différents systèmes (immunitaire, cardio-vasculaires et autres), dépend de l’expression de gènes régulés en grande partie de manière automatique, conférant à l’individu une certaine autonomie.

brain

Le cerveau est l’organe le plus important… selon le cerveau

2/ L’information neurologique / individu, espèce : Les animaux et les hommes présentent des capacités remarquables à traiter de grandes quantités d’informations, à éprouver des sensations et des émotions qui peuvent être mémorisées et communiquées. Ces possibilités sont liées au développement au cours de l’évolution et du cycle de vie d’un système nerveux complexe, impliqué dans des fonctions vitales, motrices, sensorielles et logiques. Le fonctionnement de l’encéphale dépend de l’activité de groupes de neurones qui forment des réseaux spécialisés dans la réalisation de différentes activités physiologiques. L’influx nerveux de nature électrique et biochimique rend possible des actions réflexes, non intentionnelles, ou bien au contraire rationnelles, poursuivies sur le long terme, sur la base de connaissances acquises.

bright-320

Personne n’a abimé sa vue en regardant le bon côté des choses

3/ L’information directe / individu, groupe, population, société, nation : Perçue de manière directe, sans nécessité d’un dispositif technique, l’information directe est échangée chez les hommes et les animaux dès le plus jeune âge. Ces échanges s’avèrent vitaux pour la constitution des individus, des groupes et des espèces. Des informations fixes ou mouvantes viennent guider les actions individuelles ou collectives réalisées en interaction avec l’environnement. Chez l’homme, liées aux sphères personnelles, professionnelles et privées, des informations individuelles et de groupe sont gérées. Des langues, des codes, des conventions, des habitudes et des lois font partie des outils à acquérir et mémoriser pour communiquer. Des moments et des lieux s’avèrent particulièrement favorables aux échanges, accompagnant le travail et les loisirs, le jeu et le rêve.

thinner-book-320

Vous avez l’air vraiment plus mince… Merci, on m’a enlevé mon appendice

4/ L’information médiée traditionnelle / individu, groupe, population, société, nation : Spécifiquement humaine, l’information médiée participe grandement au développement et à l’homéostasie chez l’homme. Les objets d’information traditionnels tels que les livres, les journaux et les correspondances présentent de nombreux atouts liés à leur manipulation aisée. La radio, la télévision et le cinéma sont considérés dans ce billet comme de tels médias. Ce type d’information est constitué de dessins, de logos, de publicités, d’informations écrites en différentes langues, d’émissions radiophoniques et télévisuelles. Il s’agit d’images fixes et animées, enregistrées et véhiculées sur une variété de supports, de pages, d’étiquettes, de panneaux, d’affiches et d’écrans. Certains messages d’information dont la durée de vie souhaitée est plus longue sont entreposés dans des bibliothèques, des archives et des musées dont la gestion incombe aux individus, aux villages et villes, aux institutions et aux états.

ancestors-tails-320

C’est exact, chérie, nos ancêtres avaient une queue.

5/ Les machines, l’information médiée numérique / individu, groupe, population, société, nation, biosphère : L’homme est assisté dans ses travaux et ses loisirs par de nombreuses machines comme par exemple des voitures ou des ordinateurs qui augmentent ses possibilités physiques et intellectuelles. Des capteurs constituent en quelque sorte les organes des sens de ces machines. Tout signal transmis est susceptible d’être transformé en un flux binaire qui facilite grandement la transmission, l’acquisition, la mémorisation et le traitement des données. Les microscopes, télescopes et appareils photos voient ainsi leurs performances notablement améliorées. Les ordinateurs, les smartphones, les drones, les bots et les robots rendent possible l’échange de mails, la recherche d’information, la réalisation de tâches répétitives ou impossibles à réaliser autrement. Des machines dédiées au calcul permettent encore la simulation de systèmes en vue de valider des modèles et de s’essayer à la prévision. La manipulation de grands volumes de données rend possible de nouvelles techniques comme l’intelligence artificielle dont des applications incluent la reconnaissance automatique des voix et des visages ou la traduction automatique des textes. Des maîtres d’école et des maîtres d’ouvrage et des maitres d’oeuvre élaborent et partagent des informations sur des plateformes comme Wikipédia et GitHub, accessibles via les réseaux téléphoniques et Internet. 

money-320

Restes avec moi ce mois, s’il te plait !

6/ La monnaie / individu, groupe, population, société, nation : Dernier petit détail intéressant dans le cadre des échanges de biens et de services, l’argent peut être considéré comme une information de caractère numérique liée à un support. Parmi les supports possibles, les métaux précieux, le papier et la base de donnée sécurisée se distinguent. La monnaie est une information spéciale en ce sens qu’elle sert à l’échange de biens et de services, de matière, d’énergie et de travail. L’authenticité de l’information et la préservation du support sont garantis par les banques sous le contrôle des états. Dans le cas nouveau des crypto-monnaies, l’authenticité est assurées de manière algorithmique, par la chaîne de blocs. La confiance ou son absence en un système monétaire reste une méta-information dont le caractère est typiquement humain, psychologique et légal. Elle découle des pratiques des individus, des banques et des états.

Qu’elle soit de nature biochimique, biophysique ou électrique, l’information semble avoir été façonnée au cours du temps afin d’optimiser trois fonctions différentes : la transmission, la mémorisation et la réalisation d’opérations logiques. L’information est donc l’élément qui confère à un système la capacité de s’auto-organiser, autrement dit d’agir sur l’environnement pour diminuer son entropie, ou bien encore pour augmenter son ordre interne. Le système acquiert ainsi progressivement au cours du temps des mécanismes qui lui permettent de manière automatique ou acquise de se « connaitre » lui-même, en relation avec son environnement. Proposer dès lors une information sur l’information relativement complète, une communication sur la communication, une systématique des systèmes, nécessite sans doute plus qu’un billet de blog ! En relation avec l’énergie et la matière qu’il s’agit d’utiliser judicieusement, les systèmes servent de décor à des réservoirs et à des flux d’information multiformes. La systémique apporte une méthode expérimentale susceptible de faciliter la transition de sociétés mécaniques centralisées et uniformes à des sociétés qu’il faut sans doute souhaiter plus organiques, à intelligence distribuée.

iambiante

Exemple d’information graphique

L’information avec le temps est ce qui nous forme et nous transforme. En 2010 et 2011, Jean Giraud alias Mœbius présente une exposition intitulée “Exposition Mœbius, Transe Forme”. Quelques dessins  de l’artiste à l’oeuvre foisonnante et multiforme viennent poursuivre ce billet.

Site officiel : https://www.moebius.fr/

moebius

Fabrication de l’information médiée, d’après l’affiche originale de « Transe Forme »

72_1444_tomos-b-im-accueil.gif

lincal-de-moebius

moebius_23

winter.png

In Search of Moebius (BBC 4 Documentary) : https://www.youtube.com/watch?v=jNas99oEXBU

La bande à Mœbius : https://www.youtube.com/watch?v=EGV1IgSbfa0

Exemples d’information textuelle

Dispositif de lecture à distance par Paul Otlet 

« On peut imaginer le télescope électrique, permettant de lire de chez soi des livres exposés dans la salle teleg des grandes bibliothèques, aux pages demandées d’avance. Ce sera le livre téléphoté. »

Otlet Paul, Traité de documentation : le livre sur le livre, théorie et pratique, Bruxelles, Editions Mundaneum, 1934

Un appareil personnel d’après Vanevar Busch

« Imaginons un appareil de l’avenir à usage individuel, une sorte de classeur et de bibliothèque personnels et mécaniques. Il lui faut un nom et créons-en un au hasard, « memex » fera l’affaire. Un memex, c’est un appareil dans lequel une personne stocke tous ses livres, ses archives et sa correspondance, et qui est automatisé de façon à permettre la consultation à une vitesse énorme et avec une grande souplesse. Il s’agit d’un supplément agrandi et intime de sa mémoire. »

Vannevar Bush, As we may think, The Atlantic Monthly, Washington d.c., 1945

What is time, Mr Claude Shannon ?

We know the past but cannot control it. We control the future but cannot know it.

Nous connaissons le passé mais nous ne pouvons pas le contrôler. Nous contrôlons le futur mais nous ne pouvons pas le connaitre.

Un message contenant du bruit et cependant lisible

Sleon une édtue de l’Uvinertisé de Cmabrigde, l’odrre des ltteers dnas un mot n’a pas d’ipmrotncae, la suele coshe ipmrotnate est que la pmeirère et la drenèire lteetrs sinoet à la bnnoe pclae. Le rsete peut êrte dnas un dsérorde ttoal et vuos puoevz tujoruos lrie snas porblmèe. C’est prace que le creaveu hmauin ne lit pas chuaqe ltetre elle-mmêe, mias le mot cmome un tuot.

Exemple d’information audio

WITHIN, (En…, A l’intérieur de …) Ian Clarke : https://www.youtube.com/watch?v=Y6U-vE8YKE0

Illustrations : Wikipédia, quelque part sur le web.

[A suivre… ]

Vous êtes susceptible de voir ci-dessous une publicité qui finance le logiciel libre WordPress.

Poster un commentaire

Dans la caverne enchaînés et fichés ! Oui, mais avec Platon

Les traces des concepts d’information et de communication se perdent dans les méandres du temps. Ainsi chez les grecs, Hermès est le messager des dieux, donneur de la chance, inventeur des poids et des mesures, gardien des routes et des carrefours, des troupeaux, des voyageurs et du commerce. Il guide les héros et les voleurs et conduit les âmes au royaume des morts. Demi-sœur d’Hermès, Athéna est vénérée pour sa sagesse. Elle conseille les héros, aide à l’élaboration des stratégies militaires, assiste les artisans, les artistes et les maîtres d’école. Elle personnifie la pensée. Fille d’Ouranos (le Ciel) et de Gaïa (la Terre), Mnémosyne enfin invente les mots et le langage. Aimée de Zeus, la déesse de la mémoire conçoit les neuf Muses parmi lesquelles Clio, muse de l’histoire.

Tels des super héros de Marvel, les dieux antiques ont des pouvoirs spéciaux qui les différencie des simples mortels et qui leurs sont conférés par leurs attributs. Hermès porte des sandales et un chapeau muni d’ailes, symboles de sa vélocité. Il possède un caducée, baguette de laurier ou d’olivier surmontée d’ailes et ornée de serpents dont il guérit les morsures. Athéna est une déesse guerrière pourvue de l’égide, cuirasse en peau de chèvre aux pouvoirs surnaturels, de la lance et du bouclier sur lequel est fixé la tête de Gorgone. C’est encore la déesse de la sagesse dont les attributs sont l’olivier et la chouette chevêche. L’animal est un symbole d’intelligence : il voit clair dans l’obscurité. Les attributs de Clio sont la trompette, la clepsydre (horloge hydraulique) et le rouleau sur lequel sont inscrits les hauts faits des Dieux que la muse leur rappelle pour les distraire.

Mais attardons nous plutôt sur Platon et sur sa fameuse caverne, allégorie extraite de son livre “La République” (315 av. J.-C.). Il y est question de liberté et de vérité, deux notions toujours d’actualité en 2016. Dans cette allégorie, un groupe d’hommes se retrouve enchaîné, immobilisé dans une caverne. Cependant, une ouverture se trouve en hauteur, au-dessus de leur sinistre antre. Ces étranges prisonniers n’ont jamais vu la lumière directe du soleil. Ils aperçoivent sur le mur qui leur fait face les ombres des passants qui déambulent à l’extérieur. De leur propre existence, ils ne connaissent que des ombres projetées sur le mur (facebook ?) par un feu allumé derrière eux. Ils ne perçoivent des sons extérieurs que des échos. Ils prennent ces ombres et ces bruits déformés pour la réalité. « Pourtant, ils nous ressemblent », précise Platon. Sortir de la caverne, obtenir de nouvelles informations conformes à la réalité nécessite qu’un des prisonniers soit libéré, éventuellement contre son gré. Une fois habitué à la lumière extérieure, prenant conscience de sa condition précédente, l’échappé solitaire est contraint de retourner auprès du groupe. Il tente d’expliquer ce qu’il a vu, mais il est critiqué et ses explications sont violemment rejetées.

387px-raffael_067

Platon par Raphaël (1512)

Cette théâtrale et sombre allégorie est sans doute appréciée des enseignants qui exercent leur profession auprès d’élèves et d’étudiants parfois distraits ! Sans doute nous imaginons nous tous parfois dans le rôle du prisonnier évadé essayant non sans difficulté de transmettre une information. Tels Socrate, acteurs d’une antique tragédie dont le destin est dicté par les dieux, enchaînés à nos gènes, à notre environnement, à notre histoire, fichés et catégorisés de manière informatique, nous le sommes tous certainement. Oui mais avec Platon ainsi que de nombreux autres, sur les épaules desquels il est possible de se hisser pour tenter de voir plus loin… 

378px-library_of_congress_rosenwald_4_bl-_5r

Manuscrit allemand, vers 1410

Étymologie du mot information

En français, l’information est « ce qui donne forme à l’esprit », ou de manière logiquement complémentaire « ce qui réduit l’incertitude », notamment l’incertitude inhérente au futur. Le mot provient du verbe latin « informare », qui signifie « donner forme à » ou « se former une idée de ». Le préfixe « in » dérivé de « intra » désigne l’intérieur. Le mot latin « informatio » est traduit en français par « concept » ou « idée ». En grec, la notion de forme s’exprime de deux manières quasiment synonymes : μορφή (morphe) qui désigne la forme des choses que nous observons, et εἶδος (eidos) « sorte, idée, forme, pensée, proposition » qui signifie l’idée habituelle que nous nous faisons d’une chose. Le mot πληροφορία (plērophoria) « mener à bien entièrement », « transporter complètement » est une traduction littérale du mot information. Ainsi, les étymologies latines et les traductions grecques rendent assez bien compte du sens premier me semble-t-il : l’information est une représentation codée du réel qui peut être aisément transmise à d’autres personnes, … voire à des animaux ou à des végétaux.

Quelques liens : Hermès, Allégorie de la caverne, Platon, SocrateL’école d’Athènes, Des nains sur des épaules de géants

Informatisation des données personnelles, fichiers électroniques nationaux :

Poster un commentaire

Information et commerce au 18ème et 19ème siècle : deux allégories.

L’information constitue un instrument pour toutes sortes d’activités et parmi elles le commerce, comme le montrent deux images du web récemment numérisées. Datées du 18ème et 19ème siècle, ces remarquables allégories évoquent de plaisante façon les thèmes des échanges commerciaux sur mer et sur route; une invitation au voyage et peut être au départ en vacances.

La France offrant la Liberté à l’Amérique

france-amerique-1784-f

Peinture sur toile, 1784, Jean Suau (1755-1841), visible au Musée Franco Américain, proche de Soisson. Photo RMN-Grand Palais (Château de Blérancourt) / Gérard Blot

  • Description

Au centre, se trouve l’allégorie de la France en manteau bleu, fleurs de lys et cuirasse. Elle tient par la main la Liberté et l’offre à l’Amérique représentée par un Indien portant une coiffe à plumes, qui la reçoit sur son embarcation. La Liberté porte dans sa main droite le sceptre symbole de souveraineté et dans sa main gauche le bonnet phrygien icône de la liberté. 

En arrière plan, les allégories de la Victoire représentée avec les ailes et tenant une couronne de laurier, de la Paix agenouillée coiffée d’une couronne de fleurs, de l’Abondance tenant un bouquet de fleurs et d’épis de blé, et du Commerce montrant une carte et une boussole.

Au-dessus d’eux, la Renommée annonce l’événement de sa trompette. Sur la gauche, des débardeurs entassent et déplacent des marchandises destinées aux navires de différentes nations. A l’extrême droite se trouve Hercule qui chasse de sa massue le Léopard anglais.

  • Commentaires

Le tableau témoigne de l’intérêt que connut en France la Révolution américaine (1775-1783). Il met en scène de manière imagée l’aide militaire et financière française apportée aux insurgés américains. Il résume les intérêts français de l’époque et les mobiles qui se cachent derrière l’intervention : revanche contre l’Angleterre suite à la guerre de Sept Ans, aspirations à la reconquête du commerce maritime, expansion des empires coloniaux, gloire de la France dans ses alliances. On remarque l’identité de la république américaine représentée par un indien. La carte et la boussole sont associées au commerce. Jean Suau remporte avec cette oeuvre en 1784 le concours de l’Académie royale de Toulouse.

https://www.histoire-image.org/etudes/france-offrant-liberte-amerique

Commerce and Navigation, – Lake, Internal, and Coasting Trade

Commerce-Navigation-1024x865

Lithographie introductive du rapport “A Synopsis of the Commercial and Revenue System of the United States”, 1847, E. Weber & Co. Balto. Inscriptions en pied de page : « J. G. Bruff, Del.” , “Lith. of E. Weber & Co. Balto. », “Commerce and Navigation, – Lake, Internal, and Coasting Trade.”, “Entered according to aist of congress in the year 1847 by Rob.t Mayo in the clerk office of the Dis.t Court of the District of Columbia.”

Le titre complet du rapport s’avère relativement long, suivant les usages de l’époque : “A synopsis of the commercial and revenue system of the United States, as developed by instructions and decisions of the Treasury Department for the administration of the revenue laws: accompanied with a supplement of historical and tabular illustrations of the origin, organization, and practical operations of the Treasury Department and its various bureaus, in fulfilment of that system: in eight chapters, with an appendix.”, 1847, 8 chapitres, 436 pages. Le traité détaille les lois, les instructions et les décisions d’exécution relatives aux produits importés aux Etats-Unis. Deux lithographies allégoriques introduisent ce livre parmi lesquelles en français : “Le Commerce et la Navigation, – Commerce lacustre, interne et côtier“.

  • Description de la gravure

En arrière plan, des vaisseaux de commerce de différents types naviguent sur des étendues d’eau. Sur la côte, plusieurs constructions : un phare, et une tour supportant un sémaphore. Le quai d’un port est parcouru de marchands en haut de forme et de dockers. A gauche, des entrepôts parmi lesquels circule un train à vapeur transportant des passagers et des marchandises.

Au centre, au milieu de diverses marchandises sur l’embarcadère, un personnage féminin symbolise la liberté, un pied en appui sur un globe. Elle côtoie  un aigle supportant un écu décoré d’un fanion américain avec 13 étoiles. Un grand bouclier est en appui sur une ancre de marine. Au dessus d’elle vole Mercure ou Hermes, dieu patron antique des voyageurs et du commerce, des gains financiers, des messages et de la communication, caractérisé par ses pied et son casque ailé, caducée à la main.

 Au premier plan en bas, se trouvent des rouleaux sur lesquels on peut lire : “Système d’entrepôt américain”, “Produits domestiques”, “Produits étrangers”, “Commerce interne et côtier”, “Imports et exports”,  “Tarif des États-Unis”, “Carte du monde”, “Recettes de la marine, Système de phare”. Un “Livre de comptabilité” complète la collection. Des instruments de marine parmi lesquels on reconnaît une sonde à main, une poulie, un sextant, un compas droit, une balance.

  • Commentaires

Le dessin met en scène le commerce, le transport et la navigation côtière aux États-Unis et les liens étroits que ceux-ci entretiennent avec les technologies. On remarque parmi les modes de transport un train à vapeur avec passagers et marchandises, un bateau à vapeur propulsé par roue à aube, deux innovations majeures de l’époque. Le réseau ferré américain est déjà étendu comme le montre une carte de 1840 numérisée à la Bibliothèque du Congrès : http://hdl.loc.gov/loc.gmd/g3701p.rr003340. Parmi les innovations permettant la communication, le sémaphore placé à l’entrée du port annonce l’arrivée de nouveaux bateaux.

https://fr.wikipedia.org/wiki/S%C3%A9maphore_(signalisation_maritime)

Poster un commentaire

La Théorie de l’Information de Claude Shannon

“Je sais que j’ai été compris lorsqu’on m’a répondu” Claude Shannon

Publié en 1948, l’article “A Mathematical Theory of Communication” de Claude Shannon propose de modéliser certains des concepts clés de l’information et de la communication. Nous sommes à l’issue de la seconde guerre mondiale. Le radar a prouvé son utilité, Enigma est résolue. Alors que des médias tels que la radio et la télévision rencontrent un large succès, que des moyens de télécommunication tels que le téléphone se développent, les travaux de Shannon et de quelques autres mathématiciens  vont conduire à la mise au point des premiers ordinateurs. Mais la théorie de Shannon s’avère remarquablement générale et protéiforme. Elle va notablement influencer des disciplines qui restent à être inventées telles que la robotique, l’intelligence artificielle ou la biologie moléculaire et cellulaire et contribuer significativement à l’amélioration des méthodes d’échange de l’information. Ce billet propose en commémoration du centenaire de la naissance du théoricien une courte biographie, une traduction de l’introduction de l’article ainsi que quelques idées générales sur l’information.

Claude Shannon (1916-2001)

shannon

Après un double “Bachelor of Science” en mathématiques et en génie électrique, Shannon est embauché à temps partiel en 1936 en tant que chercheur assistant au département de génie électrique du MIT (Massachusetts Institute of Technology) sous la direction de Vanevar Bush. Shannon manipule “l’analyseur différentiel” qui était le calculateur analogique le plus avancé de l’époque, capable de résoudre des équations différentielles du sixième degré. Son mémoire de master soutenu en 1938 “A Symbolic Analysis of Relay and Switching Circuits” montre que des arrangements de relais permettent de résoudre des problèmes d’algèbre booléenne, que des machines électriques peuvent faire des opérations logiques, ouvrant la voie à la création de calculateurs d’une nouvelle génération. Shannon obtient simultanément en 1940 un master de science en Génie électrique et un doctorat (PhD) en Mathématiques sur un sujet de Génétique des populations “An Algebra for Theoretical Genetics”. Il devient membre de l’“Institute for Advanced Study” à Princeton et croise occasionnellement en ces lieux des scientifiques de renom tels que Hermann Weyl, John von Neumann, Albert Einstein et Kurt Gödel. Shannon travaille ensuite à partir de 1940 aux laboratoires Bell réputés au niveau mondial dans le domaine des télécommunications. Il prend le thé en 1943 avec le mathématicien et cryptographe Alan Turing, détaché pour quelques mois de Bletchley Park. Turing théorise depuis 1936 une machine à calculer universelle et améliore des machines électromécaniques dédiées à la cryptanalyse. Dès 1945, la publication longtemps classée de Shannon “A Mathematical Theory of Cryptography” est remarquée des spécialistes. En 1948, les laboratoires Bell nomment “transistor” leur dernière invention destinée à remplacer les relais dans les circuits logiques. La même année, Norbert Wiener, professeur de mathématique au MIT publie “Cybernetics: Or Control and Communication in the Animal and the Machine”, en collaboration avec Shannon pour le chapitre 6. En juillet 1948, Shannon publie la première partie de l’article : “A Mathematical Theory of Communication” dans la revue Bell System Technical Journal. La deuxième partie est publiée en octobre de la même année.

Dans le but d’optimiser les systèmes de transmission ainsi que le fonctionnement des calculateurs, une théorie de la transmission de l’information est proposée. Les objectifs sont de trouver des méthodes qui permettent d’améliorer l’efficacité des communications, d’optimiser la quantité d’information transmise dans des canaux dont la capacité est limitée et qui génèrent du bruit. Parmi ses aspects novateurs, l’article définit le bit (binary digit ou chiffre binaire) comme l’unité élémentaire de l’information. Un modèle générique est proposé qui rend compte de la transmission de l’information quelque soit son type : information discrète, continue ou mixte. Le cas de l’information discrète avec et sans bruit est développé en première partie, aboutissant à la démonstration de multiples théorèmes illustrés d’exemples. Le calcul de l’entropie dite de Shannon est encore proposé. Cet indicateur permet de caractériser de manière statistique la quantité maximale d’information qu’il est possible de transmettre dans un canal. La formulation retenue – une fonction pondérée du logarithme de la probabilité de réception d’un signal – répond à la même équation que l’entropie de Boltzman, une grandeur établie dans le contexte de la thermodynamique. Une même formule mathématique permet de décrire de manière statistique la dissipation de l’énergie dans un système et la transmission de l’information dans un canal. De manière simplifiée et quelque peu intuitive, l’entropie caractérise le niveau de “désordre” d’un système, le niveau de variation potentielle des signaux constitutifs d’un message, l’hétérogénéité du signal, calcule l’incertitude moyenne de réception d’un signal. Plus l’entropie d’un signal discret est élevée, plus la quantité d’information susceptible d’être transmise de manière concise est importante.

Le caractère multidisciplinaire de l’information et de la communication inspire alors de nombreux scientifiques de différentes spécialités : Shannon devient le fondateur de la “Théorie de l’Information”. Il  assiste en 1950, 1951 et 1953 aux conférences de la fondation Macy à l’origine de la  cybernétique. Ces événements réunissent des scientifiques américains autour de personnalités comme Wiener et Von Neumann. On y discute de modèles d’action et de processus de décision qui concernent aussi bien les machines à calculer, que la neurophysiologie ou la psychologie. Wiener développe les concepts de “boîte noire” et de “feedback » – rétroaction en français. Ce mouvement de pensée dont l’intérêt relève de l’histoire des sciences influencera notablement les scientifiques de cette époque, accompagnant l’émergence de la biologie moléculaire et cellulaire, de la psychophysique, des sciences cognitives, de l’intelligence artificielle ou de l’informatique.

shannon-bit

Un doigt levé ou baissé, un interrupteur ouvert ou fermé, une pièce positionnée coté pile ou face, constituent des exemples simples d’unité atomique de l’information et nommé bit ou binary-digit (signal binaire) par Shannon et JW Tukey.

A Mathematical Theory of Communication” est publié dans “The Bell System Technical Journal” en juillet et octobre 1948. Une traduction de l’introduction est ici proposée.


A Mathematical Theory of Communication” : Traduction de l’introduction

Le récent développement de diverses méthodes de modulation telles que la PCM (modulation d’impulsion codée) et la PPM (modulation en position d’impulsions) qui échangent de la bande passante contre du rapport signal-bruit a intensifié l’intérêt d’une théorie générale de la communication. Une base d’une telle théorie se trouve dans les articles importants de Nyquist et Hartley à ce sujet. Dans le présent article, nous étendrons la théorie pour inclure un certain nombre de nouveaux facteurs, en particulier l’effet du bruit dans le canal, et les économies possibles dues à la structure statistique du message original et dues à la nature de la destination finale de l’information.

Le problème fondamental de la communication est celui de reproduire en un point, soit exactement soit approximativement un message sélectionné à un autre point. Fréquemment, les messages ont une signification; c’est à dire qu’ils se réfèrent à ou sont corrélées avec certains systèmes, avec certaines entités physiques ou conceptuelles. Ces aspects sémantiques de la communication ne relèvent pas du problème de l’ingénierie. L’aspect important est que le message réel est un élément choisi parmi un ensemble de messages possibles. Le système doit être conçu pour fonctionner pour chaque sélection possible, pas seulement celle qui sera effectivement choisie car celle ci est inconnue au moment de l’envoi.

Si le nombre de message dans l’ensemble est fini alors ce nombre ou toute fonction monotone de ce nombre peut être considéré comme une mesure de l’information produite quand un message est choisi parmi un ensemble, tous les choix étant équiprobables. Comme l’a souligné Hartley le choix le plus naturel est la fonction logarithmique. Bien que cette définition doive-t-être généralisée considérablement lorsque l’on considère l’influence des statistiques du message et lorsque nous avons une gamme continue de messages, nous allons utiliser dans tous les cas une mesure essentiellement logarithmique.

La mesure logarithmique est plus commode pour diverses raisons:

  1. Elle est plus utile de manière pratique. Des paramètres d’importance en ingénierie tels que le temps, la bande passante, le nombre de relais, etc., ont tendance à varier linéairement avec le logarithme du nombre de possibilités. Par exemple, l’ajout d’un relais à un groupe double le nombre d’états possibles des relais. On ajoute 1 au logarithme en base 2 de ce chiffre. Un doublement du temps multiplie au carré le nombre des messages possibles, ou double le logarithme, etc.
  2. Il est plus proche de notre sens intuitif que de la mesure elle-même. C’est étroitement liée à (1) puisque nous mesurons intuitivement les entités en comparaison linéaire avec les standards communs. On ressent, par exemple, que deux cartes perforées doivent avoir deux fois la capacité d’une seule pour le stockage de l’information, et deux canaux identiques deux fois la capacité d’un seul pour transmettre l’information.
  3. Elle est mathématiquement plus appropriée. Un grand nombre d’opérations critiques sont simples en termes de logarithme mais exigeraient autrement un retraitement maladroit en terme de nombre de possibilités.

Le choix d’une base logarithmique correspond au choix d’une unité de mesure de l’information. Si la base 2 est employée, les unités qui en résultent peuvent être appelées digits binaires, ou plus brièvement bits [binary digits], un mot suggéré par JW Tukey. Un dispositif à deux positions stables, comme un relais ou un circuit à bascule, peut stocker un bit d’information. Un nombre N de tels dispositifs peut stocker N bits, puisque le nombre total d’états possibles est 2N et log22N = N. Si la base 10 est utilisée, les unités peuvent être appelées chiffres décimaux. Puisque

log2 M = log10 M / log10 2 = 3.32 log10 M,

un chiffre décimal correspond approximativement à 3 ⅓ bits. Une roue à chiffres sur une machine à calculer de bureau a dix positions stables a donc une capacité de stockage d’un chiffre décimal. Dans les travaux analytiques dans lesquels l’intégration et le calcul différentiel sont impliqués, la base e est parfois utile. Les unités d’information résultantes seront appelées unités naturelles. Un changement de la base a en base b exige simplement une multiplication par logb a.

Par un système de communication, nous entendrons un système du type de celui indiqué schématiquement dans la Fig. 1. Il est constitué essentiellement de 5 parties:

  1. Une source d’information qui produit un message ou une suite de messages destinés à être communiqués au terminal récepteur. Le message peut être de différents types: par exemple (a) Une séquence de lettres comme dans un système de type télégraphe ou télétype; (b) Une simple fonction du temps f(t) comme dans la radio ou la téléphonie; (c) Une fonction du temps et d’autres variables comme avec la télévision noir et blanc – ici le message peut être pensé comme une fonction f(x;y;t) de deux coordonnées spatiales et du temps, l’intensité lumineuse au point (x;y) et au temps t sur la plaque du tube de récupération; (d) Deux ou plusieurs fonctions du temps, disons f(t), g(t), h(t) – c’est le cas dans le système de transmission du son en trois dimensions ou si le système est destiné à desservir plusieurs canaux individuels en multiplex. (e) plusieurs fonctions de plusieurs variables – avec la télévision couleur, le message consiste en trois fonctions f(x,y,t), g(x,y,t), h(x,y,t) définies dans un continuum tridimensionnel – nous pouvons aussi penser à ces trois fonctions comme des composantes d’un champs vecteur défini dans la région – de même, plusieurs sources de télévision en noir et blanc produiraient des « messages » constitués d’un certain nombre de fonctions de trois variables; (f) Diverses combinaisons se produisent également, par exemple pour la télévision avec une voie audio associée.
  2. Un émetteur qui intervient sur le message de manière quelconque pour produire un signal approprié à la transmission sur le canal. Dans la téléphonie cette opération consiste simplement à changer la pression sonore en un courant électrique proportionnel. Dans la télégraphie nous avons une opération d’encodage qui produit une séquence de points, de tirets et d’espaces sur le canal correspondant au message. Dans un système de multiplex PCM les différentes fonctions de la parole doivent être échantillonnées, comprimées, quantifiées et encodées, et finalement entrelacées convenablement pour construire le signal. Systèmes Vocoder, télévision et modulation de fréquence sont d’autres exemples d’opérations complexes appliquées au message pour obtenir le signal.
  3. Le canal est simplement le moyen utilisé pour transmettre le signal de l’émetteur au récepteur. Cela peut être une paire de fils, un câble coaxial, une bande de fréquences radio, un faisceau de lumière, etc.
  4. Le récepteur effectue habituellement l’opération inverse de celle effectuée par l’émetteur, reconstruisant le message à partir du signal.
  5. La destination est la personne (ou une chose) à laquelle le message est destiné.

shannon-modelNous souhaitons considérer certains problèmes généraux impliquant des systèmes de communication. Pour ce faire, il est d’abord nécessaire de représenter les différents éléments impliqués comme des entités mathématiques, convenablement idéalisées à partir de leurs équivalents physiques. Nous pouvons grossièrement classer les systèmes de communication en trois catégories principales : discret, continu et mixte. Par un système discret, nous entendons celui dans lequel le message et le signal à la fois sont une séquence de symboles discrets. Un cas typique est la télégraphie dans lequel le message est une séquence de lettres et le signal une séquence de points, de tirets et d’espaces. Un système continu est celui dans lequel le message et le signal sont tous deux traités comme des fonctions continues, par exemple, avec la radio ou la télévision. Un système mixte est celui dans lequel des variables discrètes et continues apparaissent, par exemple, la transmission de la parole en PCM.

Nous considérons d’abord le cas discret. Ce cas présente des applications non seulement dans la théorie de la communication, mais aussi dans la théorie des calculateurs, dans la conception des échanges téléphoniques et dans d’autres domaines. De plus, le cas discret constitue une base pour les cas continus et mixtes qui seront traités dans la seconde moitié du papier.

[…]


A Mathematical Theory of Communication” : le plan

Introduction, p379, fig. 1

Partie I : Systèmes discrets sans bruit
  1. Le canal discret sans bruit, p382, théorème 1, fig. 2
  2. La source discrète d’information, p384
  3. Des séries d’approximations de l’anglais, p388
  4. Représentation graphique d’un processus de Markoff, p389
  5. Sources ergodiques et mixtes, p390, fig. 3, 4, 5
  6. Choix, incertitude et entropie, p392, fig. 6, théorème 2, fig. 7
  7. L’entropie d’une source d’information, p396, théorème 3, théorème 4, théorème 5, théorème 6
  8. Représentation des opérations d’encodage et de décodage, p399, théorème 7, théorème 8
  9. Le théorème fondamental pour un canal sans bruit, p401, théorème 9
  10. Discussion, p403
  11. Exemples, p404
Partie II : Le canal discret avec bruit
  1. Représentation d’un canal discret avec bruit, p406
  2. Équivoque et capacité d’un canal, p407, théorème 10, fig. 8
  3. Le théorème fondamental pour un canal discret avec bruit, p410, théorème 11, fig. 9, fig. 10
  4. Discussion, p413
  5. Exemple d’un canal discret et de sa capacité, p415, fig. 11
  6. La capacité du canal dans certains cas spéciaux, p416, fig. 12
  7. Un exemple d’encodage efficace, p418
Appendice 1 : La croissance du nombre de blocs de symboles en condition d’état fini, p418
Appendice 2 : Dérivation de H, p419
Appendice 3 : Théorèmes sur les sources ergodiques, p420
Appendice 4 : Maximisation de la fréquence dans un système avec contraintes, p421

(à suivre)

Partie III : Préliminaires mathématiques, p623

18. Groupes et ensembles de fonctions, p623

19. Ensembles de fonctions limitées par la bande, p627

20. Entropie d’une distribution continue, p628

21. Perte d’entropie dans les filtres linéaires, p633, tableau 1

22. Entropie de la somme de deux ensembles, p635

Partie IV : Le canal continu, p637

23. La capacité d’un canal continu, p637

24. La capacité d’un canal avec une limitation de puissance moyenne, p639

25. La capacité du canal avec un pic de limitation de puissance, p642

Partie V : La fréquence pour une source continue, p646

26. Fidélité des fonctions d’évaluation, p646

27. La fréquence de la source en fonction d’une évaluation de la fidélité, p649

28. Le calcul des fréquences, p650

Remerciements, p652
Appendice 5, p652
Appendice 6, p653
Appendice 7, p655

A Mathematical Theory of Communication” : Figure 7

shannon-entropy

Dans le cas d’une information discrète à 2 valeurs en absence de bruit, l’entropie présente plusieurs propriétés intéressantes qui justifient son calcul. L’entropie représente en quelque sorte la richesse en information d’un message. Soit un message constitué d’une suite de 0 et de 1, c’est lorsque la fréquence des 0 est statistiquement égale à celle des 1 que l’entropie et la quantité d’information susceptible d’être transmise sont maximales. Si un message ne contient que des 0 ou que des 1, son entropie est nulle et il ne transmet aucune information. De manière analogue, la colonne d’une table de données qui contient toujours la même information n’apporte aucune information et est inutile à l’ensemble. Le calcul de l’entropie peut être étendu à des systèmes discrets comportant un plus grand nombre de valeurs comme dans le cas du morse, de l’alphabet ou de l’ADN par exemple.

A Mathematical Theory of Communication” : Figure 8

shannon-correction

En présence de bruit, Claude Shannon envisage la présence d’un observateur susceptible de corriger les données transmises de manière incorrecte. De manière pratique, sur les réseaux téléphoniques, la voie reste souvent compréhensible même en présence de bruit. Sur internet, l’observateur et la cible du message sont identiques. On s’assure de l’intégrité de transmission d’un fichier, par exemple, en calculant la somme de contrôle du fichier réceptionné et en la comparant avec la version d’origine, effectuant ainsi une sorte d’auto-rétroaction.

Commentaires et élucubrations

L’approche de Shannon pour modéliser l’information intrigue au premier abord : il ne s’intéresse pas au sens de l’information mais il modélise uniquement le signal et le bruit, la transmission et la perception par un « récepteur ». Il ignore la sémantique. La théorie de la communication (titre de l’article) est en fait une théorie de la transmission de l’information. L’article est relatif à la télécommunication dans son aspect physique statistique. Pour Shannon, l’information est ce qui permet de résoudre l’incertitude relative à la transmission d’un signal. L’entropie permet de calculer l’incertitude moyenne de la réception.

Mais qu’est ce que l’information au sens commun? Une analogie est souvent faite entre l’information et la matière fluide, voire gazeuse. On parle ainsi de source d’information, de canal, de flux, de lacs de données et de torrents de bits. L’amélioration du débit internet rend possible l’apparition de l’informatique en nuage. Ces plaisantes métaphores font référence à la nature dynamique de l’information. Mais en fait l’information ne relève pas de la mécanique des fluides, elle est de nature immatérielle, résulte de l’émission et de la réception de signaux véhiculant un message. On distingue classiquement l’information orale de l’information écrite qui nécessite un support pour exister : la pierre, le papier, la toile. Les mémoires informatiques telles que les cartes perforées, les mémoires magnétiques ou les mémoires flash permettent l’enregistrement d’informations de toutes sortes. L’information, mémorisée ou non, ne présente un intérêt que si elle est transmise. Si elle est mémorisée ou transmise à l’aide de machines, alors l’information peut être quantifiée.

L’efficacité de l’information dépend étroitement d’un environnement physique particulier. Sa perception est liée aux aspects sensoriels du « récepteur » : sensibilité aux ondes sonores, visuelles ou électromagnétiques, sensibilité aux molécules chimiques ou biochimiques. Le caractère conscient ou inconscient, la valeur que l’homme et la société attribuent aux informations sont des paramètres qui modifient la perception. De ces éléments dépend le fait que les infos soient transformées en connaissances, et servent à l’homme. Des questions morales, éthiques, déontologiques et légales sont fréquemment liées à l’émission et au traitement de l’information.

L’étymologie du mot « information » indique : dérivé de la racine latine « informatio » dont le sens est « ce qui donne forme à l’esprit », « ce qui instruit », « ce qui enseigne », « ce qui discipline ».  Le mot « information » est employé dans une variété de contextes. Le concept s’avère central dans des domaines aussi divers que la génétique, la culture ou les technologies. L’information ou son traitement est souvent associé à des termes polysémiques tels que « réplication », « transcription », « traduction », « mutation », « polymorphisme », « cycle de vie », « patrimoine », « identité » et « évolution ». Ainsi, patrimoine peut désigner à la fois le « patrimoine génétique » dans le cas d’espèce animales et végétales menacées, « patrimoine culturel » ou bien « patrimoine numérique ». L’identité peut être génétique, culturelle ou numérique. L’évolution peut être biologique, culturelle ou technologique. Les contextes vont de la documentation, en passant par la linguistique, le journalisme, la publicité, l’édition, l’informatique ou la biologie. L’information au sens commun peut encore changer de support ou de canal tout en restant identique. La même information peut être lue dans un journal ou vue à la télévision par exemple.

Shannon prend en quelque sorte le contre-pied du sens traditionnel pour définir l’information. Il ne s’agit pas de donner forme mais de résoudre une incertitude. Il s’affranchit ainsi du message transmis et de sa signification pour raisonner au niveau statistique et technique. En définissant le bit (0 ou 1, oui ou non), il rend quantifiable l’information en la liant à la logique. Celle-ci devient alors un objet qu’il est possible de mesurer tout autant que l’énergie, la masse, le temps, la distance ou que d’autres paramètres physiques moins prestigieux. Le bit peut alors servir de base de mesure unique pour des fonctionnalités de calcul, de mémorisation ou bien de transmission de l’information.

“Information is the resolution of uncertainty” Claude Shannon

Shannon propose ensuite le « diagramme schématique d’un système général de communication », figure 1, qui s’avère assez général, utilisé dans une multitude de domaines.

Dans son article, Shannon limite son raisonnement au cas de la transmission de l’information par les outils électriques de son époque : télégraphe, téléphone, radio, télévision. Il s’agit de transmettre un signal caractérisé par une langue, un message, des mots et des lettres, en présence de bruit. Ces éléments peuvent être analysés statistiquement. Des analyses de fréquence permettent de calculer l’entropie. Cet indicateur statistique fournit des renseignements sur la variabilité des composantes, sur le niveau d’ordre ou de désordre constitutif d’un message. Le calcul de l’entropie présente quelques intérêts pratiques dans des domaines autres que les télécommunications. Ainsi, dans le domaine de l’intelligence artificielle, les algorithmes génétiques permettent de trouver des solutions optimales dans un environnement contraint. Il s’agit d’augmenter l’entropie en introduisant des « mutations » et d’analyser l’adaptation aux contraintes obtenue. Au contraire, dans des algorithmes de classification automatique, il convient de minimiser de manière informatique l’entropie intra-classe pour faire émerger des classes homogènes. Les écologues utilisent encore l’entropie pour mesurer la diversité des espèces dans un écosystème, les sociologues utilisent l’indice de Theil fondé sur l’entropie pour mesurer la diversité des revenus dans une population.

Les relations entre l’entropie de Shannon, et l’entropie de Boltzman ont été étudiées par différentes personnalités scientifiques. Précédant Shannon de quelques années, Erwin Shrödinger dans “What is life” (1944) introduit la notion d’entropie négative ou néguentropie caractéristique de la nature de la vie,  des effets et des actions des êtres vivants. Léon Brilloin tente de démontrer dans son livre “Naissance de la théorie de l’information” (1953) l’équivalence entre l’entropie de Botzman et celle de Shannon. Pour Shannon, l’entropie est un outil statistique qui permet de caractériser le niveau d’organisation d’un message d’information. Il est encore plus que cela, une information mythique en relation avec la 2ème loi de la thermodynamique que semble défier le vivant.

ADN et biologie

Qu’en est il du vivant et de l’ADN constitué de 4 base nucléiques formant une information de caractère discret ? La célèbre molécule découverte en 1953 par Watson et Crick auxquels il est sans doute possible d’associer Rosalind Franklin constitue en effet le support d’une information tout à fait particulière : l’information génétique, base de la vie tout autant que marqueur de la présence d’une espèce ou d’un individu en un lieu. Si l’on reprend la figure 1 de Shannon, un signal informatif peut tout aussi bien correspondre à la transmission d’un ARN messager du noyau cellulaire au cytoplasme, qu’à l’émission d’une hormone et à sa réception par un tissu cible, à une réaction immunologique, à la transmission d’un signal électrique entre neurones. Un signal est une sorte de message et une interprétation large de la théorie est possible. Le schéma de la figure 1 s’avère particulièrement générique. Cependant, Shannon réfute ce genre d’interprétation, de même que la plupart des mathématiciens à l’exception notable, nous l’avons vu, de Shrödinger.

2016

Du Shannon de 1948 à Internet et au développement du web, à l’information libre sur Wikipédia, et aux logiciels et licences libres en poursuivant par les réseaux sociaux, un long chemin a été parcouru. L’usage des nouvelles technologies est devenu de nos jours banal. Il suffit de partager une langue, du matériel, un réseau et une prise électrique, et les informations sont obtenues facilement, les échanges sont aisés, le commerce électronique se développe, rendant possible l’émergence d’une société de l’information. Le numérique est devenu en quelques années un changement culturel  majeur autant qu’industriel ou technologique. De grosses entreprises dynamisent le secteur et une multitude d’acteurs secondaires se sont multipliés depuis les années soixante.

Usages

L’usage s’est généralisé en une quinzaine d’années alors que les portables et les tablettes rendent l’outil particulièrement intéressant dans les déplacements, ou pour des paiements en des lieux où les banques sont absentes. Mais, de nombreux dangers et limites liées aux technologies numériques sont faciles à mettre en évidence : addictions, piratages et fuites des données, fractures générationnelles et sociales, uniformisation, surveillance globale facilitée, émergence du darknet, primauté de l’information sur l’action.

Monnaies et crypto-monnaies

Quelques remarques complémentaires en relation peu étroite avec l’article de Shannon concernent le commerce. La monnaie est de nos jours essentiellement dématérialisée. Ce sont des flux d’information qui permettent de faire des achats et des ventes, de régler des factures. Sur Internet, de nombreuses transactions se font via le protocole sécurisé https. La figure 8 de Shannon « Diagramme schématique d’un système de correction » peut avec quelque imagination être considérée comme un modèle de transaction monétaire. L’argent est transférée entre un émetteur – l’acheteur, et un récepteur – le vendeur. Un observateur vérifie la validité du transfert de l’information. Ce dernier acteur peut jouer une multitude de rôles supplémentaires comme vérifier que l’acheteur dispose bien de la somme qu’il souhaite dépenser, que le compte du vendeur a été correctement crédité. Le intermédiaires tels que le fournisseur d’accès, la banque, les organismes tiers, peuvent être perçus comme une autorité unique susceptible de générer la confiance, et ainsi de faciliter les échanges.

Jusqu’à présent seuls les états et les banques garantissaient cette fameuse confiance. L’introduction des crypto-monnaies comme le bitcoin marque une rupture dans cette situation. Dépendant d’Internet, le bitcoin assure en effet de manière mathématique, cryptographique et logique la confiance dans la validité des transactions. Il introduit pour cela la « chaîne de blocs » qui consiste en une base de donnée chiffrée et décentralisée de l’ensemble des transactions effectuées avec cette monnaie. La chaîne de bloc est susceptible d’être utilisée dans une variété de cas pour lesquels la confiance revêt un aspect critique. On peut ainsi envisager des applications dans les secteurs des données cadastrales, des activités notariales, de la validation de titres de propriété, de l’assurance, de la traçabilité, du vote sécurisé, voire des paris et des jeux. Élaboré dans un esprit libertaire pour faire émerger une monnaie qui échappe au contrôle des banques et des états, le bitcoin et la chaîne de bloc sont cependant susceptible de conduire à la modernisation de certaines fonctions régaliennes de ceux-ci, à la modernisation des transactions entre banques et organismes.

L’information libre, oh yeah

Le caractère commun de l’information numérique intéresse tout un panel d’acteurs : sociologues, psychologues, publicitaires, enseignants, politiciens, etc. Une nouvelle discipline est même née au carrefour des sciences humaines et de l’informatique : les humanités numériques. Pour des scientifiques qui étudient cette transition de longue date tels que Michel Serres,  Pierre Levy, Bernard Stiegler, Dominique Wolton, Monique Dagnaud, Richard Dawkins, etc, ou bien pour les praticiens tels que Richard Stallman, Tim Berners Lee et bien d’autres encore une “pensée numérique” est née qui s’appuie sur Internet, dont la logique s’avère aussi imparable que 01 et 01 font 10.

Conclusion

La fécondité d’une théorie, les possibilités nouvelles qu’elle est susceptible d’apporter peut étonner, même si bien sûr la seule théorie de l’information est fort loin de faire l’informatique, le commerce et la génétique ! En sciences de l’ingénieur : reconnaissance des caractères, des visages et de la voix, économie collaborative, transactions à haute fréquence :-(, Bitcoin, BitLand, Fab-Labs :-), Git, Stack Overflow et autres listes de discussion :-), impression 3D font partie de l’usage courant, ou vont le devenir. Dans le secteur tout à fait différent des biotechnologies : tests génétiques :-), plantes transgéniques résistant aux herbicides 😦 thérapie génique :-), thérapie cellulaire :-), etc. D’autres applications restent à être inventés, mais surtout, de nouveaux équilibres restent à être trouvés entre le virtuel et le réel, entre la théorie et la pratique, entre le dogmatisme et l’empirisme, entre la culture et la nature, ou bien encore entre les intérêts communs et particuliers.

Des concepts informatiques majeurs tels que “le réseau et les échanges”, “la mémoire” ou bien “la logique et le calcul” nous rappellent sur les pas des cybernéticiens, que de nombreuses similitudes existent entre les hommes, les animaux, voire même les machines ! Ces dernières ne sont qu’une aide qui doit être regardée avec recul, dont il est sans doute fort intéressant de se passer régulièrement, pour admirer la nature, par exemple.

Dernière petite précision concernant le père de la théorie de l’information. Celui-ci prend plaisir à pratiquer le monocycle, à jongler, à construire des appareils amusants, non utilitaires et sa maison est remplie de telles inventions. Parmi celles-ci, on peut mentionner le THROBAC, un calculateur qui fait des opérations arithmétiques en chiffres romains, des “tortues” qui s’égarent dans les pièces, des machines de différentes sortes et de toutes tailles, une machine à jongler avec trois balles, ainsi que l’”Ultimate Machine”, un étonnant engin dont la portée me semble à la fois comique et philosophique ! Le mathématicien fut encore observé en train d’essayer de battre les records de son fils au Pac-Man.

Texte original

bit-generation#0

Pour comprendre

Organismes

Pour le fun

Biologie

Génétique, biologie moléculaire, évolution biologique
Neurologie
Éthologie, psychologie sociale

Culture

Informatique

Mémoire
Réseau, mobilité, partage, échange
Calcul

Pour aller plus loin

Commémorations centenaire

“All models are wrong but some are usefull” George E. P. Box (Robustness in the strategy of scientific model building, 1979)

[à suivre]

, , ,

1 commentaire

Le rapport statistique 2014

stats-2014Les statisticiens de WordPress.com ont préparé le rapport annuel 2014 de ce blog. L’année 2014 est un bon cru avec 21341 visites de 13548 visiteurs différents, soit en moyenne 1,6 visites par personne. Merci de votre fidélité, et bonne année 2015, avec une série de billets dont le premier devrait sortir dans les tous prochains jours…

Cliquez ici pour voir le rapport complet.

Poster un commentaire

Statistiques de consultation 2013 de ArchivEngines

Le rapport statistique des consultations de 2013 vient de paraître. Bravo aux statisticiens de WordPress. 4 billets ont été publiés cette année.

Merci de votre intérêt et de vos réactions, et rendez-vous pour de nouveaux posts en 2014 !
Pierre Couchet

Mois et années

jan fév mar avr mai juin juil août sept oct nov déc Total
2011 14 56 70
2012 98 138 93 128 640 557 457 299 428 726 669 745 4  978
2013 819 848 976 1  193 1  181 1  029 1  064 854 2  092 1  915 1  791 1  803 15  565
2014 33 33

Cliquez ici pour voir le rapport complet.

Poster un commentaire

Corpus scientifique numérique et ouvert, small data

Il n’est pas rare que des scientifiques soient amenés à rassembler une dizaine à plusieurs centaines de documents pour former un corpus qui servira de base à une ou plusieurs publications. Il peut aussi s’agir de partager des sources numériques, de comprendre des phénomènes complexes, de montrer, démontrer ou enseigner. Des items relatifs à un sujet, à un évènement ou à un lieu, à une personnalité remarquable, à une pratique professionnelle, culturelle ou sociale, à un organisme sont alors rassemblés. Ces documents peuvent provenir d’archives (ouvrage ancien, photo, document audio ou vidéo, correspondance, plan, carte, dessin, manuscrit, reconstitution 3D, tableau de données, données), de bibliothèques (article, thèse, livre, rapport) ou de musées. Des choix éditoriaux doivent être faits. Un objet isolé n’éclaire pas la recherche. Seul  le nombre et la diversité permet de faire émerger des tendances, des évènements marquant des ruptures, de mettre en évidence des relations, dépendant de paramètres comme le temps, le lieu ou l’environnement. Des scientifiques de différentes disciplines peuvent utiliser le même corpus, apportant chacun leur propre regard, ou conduisant à sa modification, conduisant à l’émergence d’une communauté. La démarche concerne aussi bien les Sciences Humaines (linguistique, histoire, ethnologie, philosophie, archéologie, sociologie) que les Sciences dites exactes (biologie, médecine, environnement).

L’usage de données numériques présente alors de nombreux avantages. Des scientifiques itinérants ou des équipes délocalisées peuvent travailler à distance. Des analyses statistiques des métadonnées ou des contenus permettent de mettre en évidence des thèmes, le rôle de personnes ou d’organismes, des relations. Si certains corpus tiennent de la base bibliographique, d’autres rassemblent de nombreux objets d’archive qu’il convient de gérer. Des précautions particulières doivent alors être prises pour classer et préserver sur le long terme les fichiers qui peuvent résulter de couteuses numérisations. Les métadonnées peuvent inclure des transcriptions, des traductions ou des annotations. Des objets de différentes provenances (archives, bibliothèques, musées, internet) peuvent être ainsi rassemblés.

Des questions juridiques doivent être résolues. L’utilisation de licences « Creative Commons », « Domaine public » ou « Etalab » facilite les échanges. Le crowdsourcing (la réalisation de transcriptions ou de traductions par une communauté élargie), voire le crowdfounding (des apports financiers individuels ou collectifs destinés à l’avancement du projet) deviennent possibles. Des difficultés d’ordre technique ou financier se posent encore bien évidemment.

Cependant, l’élaboration d’un corpus ne constitue qu’une première étape de la démarche scientifique. Comme le précise plaisamment Henri Poincaré dans son fameux livre “La science et l’hypothèse” : “On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n’est pas plus une science qu’un tas de pierres n’est une maison”. Au-delà des objectifs de collecte, les corpus nécessitent diverses interprétations pour prendre sens. L’étude conduit en général à la publication de livres, de thèses, de rapports, d’articles, ou encore à la production d’enseignements, d’expositions, de films documentaires. Soutenus en France au niveau national et régional, le corpus est un outil majeur des Humanités numériques.

Quelques exemples provenant de différentes disciplines complètent cet article. Même s’ils ne sont pas assez nombreux et détaillés pour constituer corpus !, ils permettent de mieux se rendre compte de l’ancienneté, de la diversité et de la fécondité de la méthode. L’expertise s’avère nécessaire aussi bien lors du choix des documents que lors de l’interprétation. Des partis pris, des conflits d’intérêts, des ignorances peuvent éventuellement fausser des résultats. Une communauté d’experts appuyée par différents corps de métiers incluant des spécialistes de la numérisation, de l’informatique, de la documentation, de la communication, du droit conduit généralement à la réussite d’un projet. Si l’ouverture des données et l’interopérabilité sont privilégiés, cette aventure collective peut devenir profitable pour la science et l’enseignement , voire le grand public.

Corpus : http://fr.wikipedia.org/wiki/Corpus
Crowdsourcing : http://fr.wikipedia.org/wiki/Crowdsourcing
Guide pratique pour la production de corpus numérique (en SHS) : http://www.mutec-shs.fr/sites/www.mutec-shs.fr/files/Guide%20pratique%20pour%20la%20production%20de%20corpus%20num%C3%A9rique_0.pdf
Source primaire : http://fr.wikipedia.org/wiki/Source_primaire
Crowdfounding sur Gallica (BNF) : http://www.amisbnf.org/books.html

Quelques exemples de corpus

Les corpus sont utilisés depuis l’antiquité grecque au moins. Diogène Laërce dans sa liste des œuvres d’Aristote montre l’existence d’un ouvrage dont seul le titre est parvenu jusqu’à nous : “Des Constitutions des villes (cent cinquante-huit) et en particulier des constitutions démocratiques, oligarchiques, aristocratiques et tyranniques”. Un corpus de textes ou de récits oraux a dû préexister à l’écriture de l’ouvrage disparu. Attribué aussi à Aristote et à ses élèves, “Constitution d’Athènes” permet de mieux se rendre compte du contenu possible à savoir l’histoire politique et sociale des cités grecques. Le corpus donne alors lieu à l’ouvrage majeur d’Aristote : les Politiques.

Catalogue_des_œuvres_d’Aristote_selon_Diogène_Laërce : http://fr.wikipedia.org/wiki/Catalogue_des_œuvres_d’Aristote_selon_Diogène_Laërce
Constitution_d’Athènes : http://fr.wikipedia.org/wiki/Constitution_d’Athènes
Constitution d’Athènes, Aristote : http://remacle.org/bloodwolf/philosophes/Aristote/tableconstitution.htm les Politiques : https://fr.wikipedia.org/wiki/Politique_%28Aristote%29

1486, Jean Pic de la Mirandole publie en vue d’en débattre publiquement à Rome “Conclusiones philosophicae, cabalasticae et theologicae” (900 conclusions philosophiques, cabalistiques et théologiques), une oeuvre en latin basée sur la lecture et sur une tentative de synthèse des textes de Platon, d’Aristote, de l’hermétisme et de la Kabbale. Sa démarche lui vaudra d’être considéré comme hérétique. Son oeuvre sera 200 ans plus tard vertement critiquée par Voltaire : « Il est encore plus extraordinaire que ce prince, ayant étudié tant de langues, ait pu à vingt-quatre ans soutenir à Rome des thèses sur tous les objets des sciences, sans en excepter une seule. On trouve à la tête de ses ouvrages quatorze cents conclusions générales sur lesquelles il offrit de disputer. (..) L’histoire du prince de La Mirandole n’est que celle d’un écolier plein de génie, parcourant une vaste carrière d’erreurs, et guidé en aveugle par des maîtres aveugles».

Jean Pic de la Mirandole : http://fr.wikipedia.org/wiki/Jean_Pic_de_la_Mirandole

Mathématicien, physicien, philosophe et ingénieur français, Henri Poincaré (1854-1912) a établi une volumineuse correspondance, échangeant avec sa famille et avec d’autres scientifiques de différentes disciplines. Le LHSP-AHP (CNRS) publie un corpus en accès libre comprenant plus de 2000 lettres numérisées, écrites de la main de Poincaré ou dont il est le destinataire. L’étude inclue des transcriptions et des annotations mettant en évidence les thèmes et les réseaux sociaux du savant, et de retracer le contexte scientifique, culturel ou social précédant la première guerre mondiale. Le laboratoire a produit jusqu’à présent 2 ouvrages relatifs à cette correspondance.

Henri Poincaré : http://fr.wikipedia.org/wiki/Henri_Poincaré
La correspondance d’Henri Poincaré : https://www.univ-nancy2.fr/poincare/chp/
“La correspondance entre Henri Poincaré et Gösta Mittag-Leffler”, Philippe Nabonnand, 1999 : http://www.springer.com/birkhauser/mathematics/book/978-3-7643-5992-8
La correspondance entre Henri Poincaré et les physiciens, chimistes et ingénieurs, Scott Walter et al., 2007 : http://www.springer.com/birkhauser/history+of+science/book/978-3-7643-7136-4

En plus de ses travaux de recherche, l’Inserm assume une mission d’expertise scientifique indépendante auprès des décideurs agissant dans le domaine de la santé publique (ministères, agences, caisses d’assurance maladie, mutuelles, associations…). La réalisation de ces expertises suit une procédure bien établie incorporant la mise au point préalable d’un corpus. Des articles et documents sont sélectionnés en relation avec les questions scientifiques d’un cahier des charges, puis sont remis à un groupe d’experts de divers champ de compétences. Le fonds documentaire est actualisé durant l’expertise et complété. L’Inserm a ainsi publié depuis 1994 prés de 70 expertises collectives sur des sujets médicaux et de santé publique très divers, apportant l’éclairage nécessaire aux prises de décisions en matière de soins, de dépistage et de prévention. Les rapports sont accessibles librement.

Principes et méthodes de l’expertise collective à l’Inserm :
http://www.ipubli.inserm.fr/themes/Inserm_ExpColl/static/methodologie.html
Archive des expertises collectives :
http://www.inserm.fr/thematiques/sante-publique/expertises-collectives/archives-des-expertises-collectives

Nicole Loupvent quitte en 1531 son abbaye, de Saint-Mihiel en Meuse, pour se rendre à Jérusalem. Tout au long du voyage, qui durera 3 mois, il prendra des notes qui lui serviront à faire un récit au jour le jour, et qu’il consignera dans deux manuscrits conservés à la bibliothèque bénédictine de Saint-Mihiel. Réalisé par l’Université de Lorraine, le site www.domloupvent.fr rassemble plus de 100 vidéos comprenant un film documentaire et des interviews d’enseignants et de chercheurs. Quelques manuscrits originaux accompagnés d’une transcription viennent compléter le site destiné à l’enseignement et à un large public amateur d’histoire de la renaissance et d’histoire des religions.

Le site référencé sur « Université ouverte des humanités » : http://www.uoh.fr/front/notice?id=5d17a5a6-75e0-4668-a1b5-6933d66e327e
La coexistence religieuse au XVIe siècle et aujourd’hui, à partir de l’histoire du pèlerinage de Dom Loupvent en 1531 (formation numérique) : http://rpn.univ-lorraine.fr/UOH/DOMLOUPVENT/co/domloupvent_web.html
Dom loupvent , Voyage d’un lorrain en Terre Sainte au XVIème siècle  (livre) : http://livre.fnac.com/a2025761/P-Martin-Dom-loupvent

De nombreux autres exemple touchant d’autres domaines scientifiques comme l’environnement avec les travaux du GIEC auraient pu être pris. La méthode scientifique est commune et s’apparente à celle de l’enquête dans laquelle il s’agit de trouver le vrai, de démontrer en réunissant de nombreux indices…

Poster un commentaire