CINXE.COM
Sciences des données : de la logique du premier ordre à la Toile - Sciences des données : de la logique du premier ordre à la Toile - Collège de France
<!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr"> <head> <meta charset="utf-8" /> <meta name="viewport" content="width=device-width, initial-scale=1" /> <link rel="icon" type="image/x-icon" href="/assets/images/favicon.ico" /> <link rel="shortcut icon" type="image/x-icon" href="/assets/images/favicon.ico" /> <title> Sciences des données : de la logique du premier ordre à la Toile - Sciences des données : de la logique du premier ordre à la Toile - Collège de France </title> <link rel="stylesheet" href="/assets/front/css/front.0367253e.css" /> <link rel="alternate" type="application/rss+xml" title="RSS" href="https://books.openedition.org/oep/backend/?format=rss" /> <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/"/> <meta name="DC.format" content="text/html"/> <meta name="generator" content="Lodel 2.0" /> <meta name="DC.identifier" content="https://books.openedition.org/cdf/529" /> <meta name="url" content="https://books.openedition.org/cdf/529" /> <link rel="alternate" hreflang="x-default" href="https://books.openedition.org/cdf/529" /> <link rel="alternate" hreflang="en" href="https://books.openedition.org/cdf/529?lang=en" /> <link rel="alternate" hreflang="fr" href="https://books.openedition.org/cdf/529?lang=fr" /> <link rel="canonical" href="https://books.openedition.org/cdf/529" /> <meta property="og:url" content="https://books.openedition.org/cdf/529" /> <meta name="citation_title" content="Sciences des données : de la logique du premier ordre à la Toile" /> <meta property="og:title" content="Sciences des données : de la logique du premier ordre à la Toile" /> <link rel="Contents" href="https://books.openedition.org/cdf/506" /> <meta name="thumbnail" content="/cdf/file/530/cover/couvliabiteboul.jpg/download/200" /> <meta name="og:image" content="/cdf/file/530/cover/couvliabiteboul.jpg/download/200" /> <meta name="description" xml:lang="fr" lang="fr" content=" Monsieur l’Administrateur,Mes chers collègues,Chers amis,En cette journée internationale de la femme, j’aimerais dédier ma leçon inaugurale à l’étudiante en informatique, à l’étudiante en mathématiques ou en sciences qui est si rare sur nos campus. Elle est assise au premier rang. Elle pianote peut-être un SMS en s’aidant de ses deux pouces. Elle est peut-être la « Petite Poucette » de Michel Serres, qui m’offre une transition parfaite pour situer" /> <meta name="citation_abstract" content=" Monsieur l’Administrateur,Mes chers collègues,Chers amis,En cette journée internationale de la femme, j’aimerais dédier ma leçon inaugurale à l’étudiante en informatique, à l’étudiante en mathématiques ou en sciences qui est si rare sur nos campus. Elle est assise au premier rang. Elle pianote peut-être un SMS en s’aidant de ses deux pouces. Elle est peut-être la « Petite Poucette » de Michel Serres, qui m’offre une transition parfaite pour situer" /> <meta property="og:description" content=" Monsieur l’Administrateur,Mes chers collègues,Chers amis,En cette journée internationale de la femme, j’aimerais dédier ma leçon inaugurale à l’étudiante en informatique, à l’étudiante en mathématiques ou en sciences qui est si rare sur nos campus. Elle est assise au premier rang. Elle pianote peut-être un SMS en s’aidant de ses deux pouces. Elle est peut-être la « Petite Poucette » de Michel Serres, qui m’offre une transition parfaite pour situer" /> <meta name="DC.type" content="BookSection" /> <link rel="Prev" href="https://books.openedition.org/cdf/528" title="Présentation de Serge Abiteboul" /> <meta name="citation_publication_date" content="2012/01"/> <link rel="Start" href="https://books.openedition.org/cdf/528" title="Présentation de Serge Abiteboul" /> <meta name="copyright" content="Licence OpenEdition Books" /> <meta name="DC.rights" content="Licence OpenEdition Books" /> <meta name="author" content="Abiteboul, Serge" /> <meta name="citation_author" content="Serge Abiteboul" /> <meta name="citation_online_date" content="2013/01/24"/> <meta name="citation_doi" content="10.4000/books.cdf.506" /> <meta name="citation_fulltext_world_readable" content="" /> <link rel="related" type="application/rdf+xml" id="zotero_rdf" href="http://core.openedition.org?action=getBibliontology&siteName=cdf&platform=OB&objectID=529" title="RDF Bibliontology" /> <meta property="og:type" content="book" /> <meta name="DC.language" content="fr" /> <meta name="citation_language" content="fr" /> <meta name="twitter:card" content="summary" /> <meta name="twitter:site:id" content="1109490079" /> <link rel="search" type="application/opensearchdescription+xml" href="http://www.openedition.org/opensearch_desc.xml" title="Search on OpenEdition" /> <meta name="citation_publisher" content="Collège de France;" /> </head> <body class="lodel "> <div class="skiplink"> <nav class="skiplink__container" role="navigation" aria-label="Accès rapide"> <ul class="skiplink__list"> <li class="skiplink__list__item"> <a class="skiplink__list__item__link" href="#skiplink-main"> Contenu principal </a> </li> <li class="skiplink__list__item"> <a class="skiplink__list__item__link" href="#skiplink-menu"> Menu </a> </li> <li class="skiplink__list__item"> <button class="skiplink__list__item__link oesearch__button"> Rechercher </button> </li> </ul> </nav> </div> <div id="openbarre" class="openbarre openbarre--extended"> <div class="openbarre__left openbarre__left--extended" id="openbarre-left"> <a class="openbarre__left__logo openbarre__left__logo--extended" id="oebooks-logo" href="/"> <img src="/assets/images/oebooks-logo.png" alt="OpenEdition Books" width="200" height="120" /> </a> <div class="openbarre__left__link openbarre__desktop__elm--flex"> <div class="openbarre__left__link__item"> <a id="link_to_the_homepage" href="/"> Accueil </a> </div> <div class="openbarre__separator openbarre__separator--center"></div> <div class="openbarre__left__link__item"> <a href="/catalogue"> Catalogue de 14901 livres </a> </div> <div class="openbarre__separator openbarre__separator--center"></div> <div class="openbarre__left__link__item"> <a href="/publishers"> Éditeurs </a> </div> <div class="openbarre__separator openbarre__separator--center"></div> <div class="openbarre__left__link__item"> <a href="/authors"> Auteurs </a> </div> </div> </div> <div class="openbarre__right openbarre__right--extended" id="openbarre-right"> <div class="openbarre__right__link"> <div class="openbarre__right__link__item openbarre__right__link__item--dropdown rounded--light"> <button class="openbarre__right__link__item__title"> <i class="fas fa-language"></i> <span class="openbarre__right__link__item__title__span long">Français</span> <span class="openbarre__right__link__item__title__span short">FR</span> <i class="fas fa-caret-down"></i> </button> <div class="openbarre__right__link__item__dropdown border shadow"> <button class="openbarre__right__link__item__dropdown__item__link openbarre_hover_link choose_language" data-locale="en"> English </button> </div> </div> <div class="openbarre__separator openbarre__separator--right"></div> <div class="openbarre__right__link__item openbarre__right__link__item--dropdown" id="openbarre-share"> <button class="openbarre__right__link__item__title"> <i class="fas fa-share-alt"></i> <span class="openbarre__right__link__item__title__span--left"> Partager </span> </button> <div class="openbarre__right__link__item__dropdown border shadow"> <a class="openbarre__right__link__item__dropdown__item__link openbarre_hover_link" href="https://www.facebook.com/sharer.php?u=https%3A%2F%2Fbooks.openedition.org%2F%2F&title=OpenEdition+Books"> <i class="fab fa-facebook"></i> <span class="openbarre__right__link__item__dropdown__item__link__label m-0"> Facebook </span> </a> <a class="openbarre__right__link__item__dropdown__item__link openbarre_hover_link" href="http://x.com/share?text=OpenEdition+Books&url=https%3A%2F%2Fbooks.openedition.org%2F%2F&via=OpenEditionActu"> <i class="fab fa-x-twitter"></i> <span class="openbarre__right__link__item__dropdown__item__link__label m-0"> X </span> </a> </div> </div> </div> <div class="openbarre__right__all"> <div class="openbarre__right__all__mobile"> <button class="openbarre__right__all__button--flex openbarre__mobile__elm oesearch__button" aria-label="OpenEdition Search button"><span class="openbarre__tablet__elm">OpenEdition Search</span> <i class="fas fa-search icon--grey icon--marginr"></i></button> <button class="openbarre__right__all__button openbarre__right__all__button--flex" id="all-oe-button" aria-label="Tout OpenEdition button"><span class="openbarre__tablet__elm me-2">Tout OpenEdition</span><i class="fas fa-bars openbarre__right__all__button__icon"></i></button> </div> <div class="openbarre__right__all__menu openbarre__right__all__menu--extended border shadow" id="all-oe-menu"> <div class="openbarre__right__link openbarre__right__link--reduced" id="openbarre__right__link--reduced"> <div class="openbarre__right__link__item openbarre__right__link__item--reduced"> <div class="openbarre__right__link__item__title--reduced" data-dropdown-reduced-target="2"> <div> <i class="fas fa-share-alt"></i> <span class="openbarre__right__link__item__title__span">Partager</span> </div> <i class="fas fa-caret-down"></i> </div> <div class="openbarre__right__link__item__dropdown--reduced" hidden data-dropdown-reduced-id="2"> <div class="openbarre__right__link__item__dropdown__item"> <a class="openbarre__right__link__item__dropdown__item__link" href="https://www.facebook.com/sharer.php?u=https%3A%2F%2Fbooks.openedition.org%2F%2F&title=OpenEdition+Books"> <div class="openbarre__right__link__item__dropdown__item__link__icon facebook"> <i class="fab fa-facebook"></i> </div> <p class="m-0">Facebook</p> </a> </div> <div class="openbarre__right__link__item__dropdown__item"> <a class="openbarre__right__link__item__dropdown__item__link" href="http://x.com/share?text=OpenEdition+Books&url=https%3A%2F%2Fbooks.openedition.org%2F%2F&via=OpenEditionActu"> <div class="openbarre__right__link__item__dropdown__item__link__icon x"> <i class="fab fa-x-twitter"></i> </div> <p class="m-0">X</p> </a> </div> </div> </div> </div> <a class="openbarre__right__all__menu__link openbarre__right__all__menu__link--first openbarre__mobile__elm tabindex--all-oe-menu" href="/" tabindex="-1">Accueil</a> <a class="openbarre__right__all__menu__link openbarre__mobile__elm tabindex--all-oe-menu" href="/catalogue" tabindex="-1">Catalogue de 14901 livres</a> <a class="openbarre__right__all__menu__link openbarre__mobile__elm tabindex--all-oe-menu" href="/publishers" tabindex="-1">Éditeurs</a> <a class="openbarre__right__all__menu__link openbarre__right__all__menu__link--last openbarre__mobile__elm tabindex--all-oe-menu" href="/authors" tabindex="-1">Auteurs</a> <span class="openbarre__right__all__menu__title openbarre__right__all__menu__title--first">Ressources numériques en sciences humaines et sociales</span> <a class="openbarre__right__all__menu__link tabindex--all-oe-menu" href="https://openedition.org" tabindex="-1">OpenEdition</a> <span class="openbarre__right__all__menu__title">Nos plateformes</span> <a class="openbarre__right__all__menu__link tabindex--all-oe-menu" href="https://books.openedition.org" tabindex="-1">OpenEdition Books</a> <a class="openbarre__right__all__menu__link tabindex--all-oe-menu" href="https://journals.openedition.org" tabindex="-1">OpenEdition Journals</a> <a class="openbarre__right__all__menu__link tabindex--all-oe-menu" href="https://hypotheses.org" tabindex="-1">Hypothèses</a> <a class="openbarre__right__all__menu__link tabindex--all-oe-menu" href="https://calenda.org" tabindex="-1">Calenda</a> <span class="openbarre__right__all__menu__title">Bibliothèques</span> <a class="openbarre__right__all__menu__link tabindex--all-oe-menu" href="https://www.openedition.org/14043" tabindex="-1">OpenEdition Freemium</a> <span class="openbarre__right__all__menu__title">Suivez-nous</span> <div class="openbarre__right__all__menu__networks"> <a class="footer__networks__icon facebook tabindex--all-oe-menu" href="https://www.facebook.com/openedition" title="Facebook" tabindex="-1"><i class="fab fa-facebook"></i></a> <a class="footer__networks__icon x tabindex--all-oe-menu" href="https://x.com/OpenEditionActu" title="X" tabindex="-1"><i class="fab fa-x-twitter"></i></a> <a class="footer__networks__icon linkedin tabindex--all-oe-menu" href="https://fr.linkedin.com/company/cleo-centre-pour-l%27%E2%80%8B-dition-lectronique-ouverte-" title="LinkedIn" tabindex="-1"><i class="fab fa-linkedin"></i></a> <a class="footer__networks__icon rss tabindex--all-oe-menu" href="https://books.openedition.org/rss/?format=rss" title="Flux RSS" tabindex="-1"><i class="fas fa-rss"></i></a> </div> <a class="openbarre__right__all__menu__link tabindex--all-oe-menu" href="https://www.openedition.org/41045" tabindex="-1">Newsletter</a> </div> </div> </div> <div class="openbarre__modal__background" id="oesearch-modal-bg" hidden></div> <div class="openbarre__modal openbarre__modal--search" id="oesearch-modal" hidden> <div class="openbarre__modal__header openbarre__modal__header--search"> <img class="openbarre__modal__header__logo" src="/assets/images/oesearch-logo-white.svg" alt="OpenEdition Search" loading="lazy" /> <button class="openbarre__modal__header__close openbarre__modal__header__close--search tabindex--oesearch" id="oesearch-modal-close" aria-label="Fermer" tabindex="-1"><i class="fas fa-times"></i></button> </div> <div class="openbarre__modal__body openbarre__modal__body--search"> <form class="openbarre__modal__body__form"> <div class="openbarre__modal__body__form__searchbar"> <p class="openbarre__modal__body__form__searchbar__accroche">Redirection vers OpenEdition Search.</p> <label class="mb-1" for="oesearch_searchbar"> Expression ou mot-clé (tag) </label> <input id="oesearch_searchbar" class="tabindex--oesearch" type="search" aria-label="OpenEdition Search text input" placeholder="Rechercher..." tabindex="-1" data-site="Collège de France"> </div> <div class="openbarre__modal__body__form__radio"> <fieldset> <div class="openbarre__modal__body__form__radio__item"> <input class="tabindex--oesearch" type="radio" name="oesearch" id="oesearch_onoebooks" value="openedition_books" tabindex="-1" checked> <label for="oesearch_onoebooks">Dans Collège de France</label> </div> <div class="openbarre__modal__body__form__radio__item"> <input class="tabindex--oesearch" type="radio" name="oesearch" id="oesearch_inalloe" value="all_openedition" tabindex="-1"> <label for="oesearch_inalloe">Dans tout OpenEdition</label> </div> </fieldset> </div> <button id="oesearch_submit" type="button" class="openbarre__modal__body__form__submit tabindex--oesearch" tabindex="-1">Rechercher</button> </form> </div> </div> </div> <div id="content"> <ul class="breadcrumb desktop"> <li class="breadcrumb__item"> <a href="/cdf"> Collège de France </a> </li> <span class="breadcrumb__arrow">›</span> <li class="breadcrumb__item"> <a href="/cdf/156"> Leçons inaugurales </a> </li> <span class="breadcrumb__arrow">›</span> <li class="breadcrumb__item"> <a href="/cdf/506"> Sciences des données : de la logique du ... </a> </li> <span class="breadcrumb__arrow">›</span> <li class="breadcrumb__item breadcrumb__item--active"> <span> <span xml:lang="fr" lang="fr">Sciences des données : de la logique du ...</span> </span> </li> </ul> <ul class="breadcrumb mobile"> <li class="breadcrumb__item"> <a href="/cdf"> Collège de France </a> </li> </ul> <div id="main" class="main main--minified"> <main data-primary-color="#004c93" data-secondary-color="#636363"> <div class="column--main column--main--header"> <header class="header border"> <div class="header__border"> <div class="header__shape"></div> </div> <div class="header__image"> <a href="/cdf"> <img class="py-3" src="/cdf/file/options/15/download" alt="Collège de France" loading="lazy" /> </a> </div> <div class="header__body"> <div class="header__title"> <a href="/cdf">Collège de France</a> </div> </div> </header> </div> <div class="column--main"> <article> <div class="column--template"> <div class="widget--content column--book"> <div class="column--book__items desktop"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/506" title="Sciences des données : de la logique du premier ordre à la Toile"><div class="widget--content__cover content__list__item__cover "><img class="content__list__item__cover__img content__list__item__cover__img--content" alt="Sciences des données : de la logique du premier ordre à la Toile" src="/cdf/file/530/cover/couvliabiteboul.jpg/download/200" loading="lazy" /></div></a><a class="column--book__body__link" href="/cdf/530"> Informations sur la couverture </a><div class="widget--content__container"><div class="widget--content__container__search"><form class="widget--content__container__search__bar" method="get"><label class="widget--content__container__search__title" for="search-book"> Rechercher dans le livre </label><div class="widget--content__container__search__bar__field"><input id="search-book" class="widget--content__container__search__bar__input" type="text" placeholder="Rechercher..." name="q" required /><button class="widget--content__container__search__bar__button" type="submit" aria-label="Rechercher"><i class="fa-solid fa-magnifying-glass"></i></button></div></form></div><a class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large toc" href="/cdf/506?format=toc" title="Sciences des données : de la logique du premier ordre à la Toile">Table des matières</a><button class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large citeButton">Citer</button><button class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large shareButton">Partager</button><button class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large citedByButton">Cité par</button></div> </div> <div class="column--book__items mobile"> <div class="column--book__folded" data-column="book"> Liens vers le livre <i class="fas fa-chevron-down"></i> </div> <div class="column--book__body" data-column="book"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/506" title="Sciences des données : de la logique du premier ordre à la Toile"><div class="widget--content__cover content__list__item__cover "><img class="content__list__item__cover__img content__list__item__cover__img--content" alt="Sciences des données : de la logique du premier ordre à la Toile" src="/cdf/file/530/cover/couvliabiteboul.jpg/download/200" loading="lazy" /></div></a><a class="column--book__body__link" href="/cdf/530"> Informations sur la couverture </a><div class="widget--content__container"><div class="widget--content__container__search"><form class="widget--content__container__search__bar" method="get"><label class="widget--content__container__search__title" for="search-book"> Rechercher dans le livre </label><div class="widget--content__container__search__bar__field"><input id="search-book" class="widget--content__container__search__bar__input" type="text" placeholder="Rechercher..." name="q" required /><button class="widget--content__container__search__bar__button" type="submit" aria-label="Rechercher"><i class="fa-solid fa-magnifying-glass"></i></button></div></form></div><a class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large toc" href="/cdf/506?format=toc" title="Sciences des données : de la logique du premier ordre à la Toile">Table des matières</a><button class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large citeButton">Citer</button><button class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large shareButton">Partager</button><button class="widget--content__container__block widget--content__container__block--button widget--content__container__block--large citedByButton">Cité par</button></div> </div> <div class="column--book__folded column--book__folded--marginbottom" data-column="read"> Formats de lecture <i class="fas fa-chevron-down"></i> </div> <div id="right-column-mobile-container" class="column--book__body column--book__body--marginless" data-column="read"></div> </div> <nav class="plan plan--desktop"> <p class="plan__title">Plan</p> <div class="plan__body"> <a class="plan__body__item" href="#anchor-completeplan" title="Plan détaillé"> Plan détaillé </a> <a class="plan__body__item" href="#anchor-fulltext" title="Texte intégral"> Texte intégral </a><a class="plan__body__item" href="#anchor-toc-1-1" title="1. Données, information et connaissances" > 1. Données, information et connaissances </a><a class="plan__body__item" href="#anchor-toc-1-4" title="2. Les systèmes relationnels et la logique du premier ordre" > 2. Les systèmes relationnels et la logique du premier ordre </a><a class="plan__body__item" href="#anchor-toc-1-10" title="3. Les moteurs de recherche de la Toile " > 3. Les moteurs de recherche de la Toile </a><a class="plan__body__item" href="#anchor-toc-1-16" title="4. Réseaux et connaissances collectives " > 4. Réseaux et connaissances collectives </a><a class="plan__body__item" href="#anchor-toc-1-23" title="5. La Toile des connaissances" > 5. La Toile des connaissances </a><a class="plan__body__item" href="#anchor-toc-1-29" title="Conclusion" > Conclusion </a><a class="plan__body__item" href="#anchor-footnotes" title="Notes de bas de page"> Notes de bas de page </a><a class="plan__body__item" href="#anchor-persons" title="Auteur"> Auteur </a> </div> <div class="plan__directions"> <button class="plan__directions__item top" title="Aller en haut de page" tabindex="0"> <i class="fas fa-arrow-up me-2"></i> Aller en haut de page </button> <button class="plan__directions__item bottom" title="Aller en bas de page" tabindex="0"> <i class="fas fa-arrow-down me-2"></i> Aller en bas de page </button> </div> </nav> </div> <div id="reviewedByModal" class="modale modale--hidden" aria-hidden="true"> <div class="modale__background modale__close"></div> <div class="modale__content"> <div class="modale__content__header modale__header"> <div class="modale__content__header__title"> <p class="modale--review__title">Sciences des données : de la logique du premier ordre à la Toile</p> </div> <button type="button" class="modale__close modale__content__header__close tabindex--reviewedby" aria-label="Fermer" tabindex="-1"> <i class="fas fa-times"></i> </button> </div> <div class="modale__content__body mt-4"> <p class="modale__content__body__label"> Ce livre est recensé par </p> <ul class="modale__content__body__list"> </ul> </div> </div> </div> <div class="column--content position-relative analyze_external_links"> <div class="widget--select2 desktop"> <label for="chapter-navigation" class="widget--select2__label"> Naviguer dans le livre </label> <div class="widget--select2__block"> <a class="widget--select2__button" href="/cdf/528" title="Présentation de Serge Abiteboul"><i class="fas fa-chevron-left me-2"></i>Précédent</a> <select id="chapter-navigation" class="select2" style="width: 100%"> <option class="px-3" value="/cdf/528" title="Présentation de Serge Abiteboul" > Présentation de Serge Abiteboul </option> <option class="px-3" value="/cdf/529" title="Sciences des données : de la logique du premier ordre à la Toile" selected> <span xml:lang="fr" lang="fr">Sciences des données : de la logique du premier ordre à la Toile</span> </option> </select> <a class="widget--select2__button widget--select2__button--disabled" aria-disabled="true" disabled>Suivant<i class="fas fa-chevron-right ms-2"></i></a> </div> </div> <div class="widget--select2 mobile"> <div class="widget--select2__block"> <a class="widget--select2__button" href="/cdf/528" title="Présentation de Serge Abiteboul"><i class="fas fa-chevron-left"></i></a> <a class="widget--select2__button w-100" href="/cdf/506?format=toc" title="Sciences des données : de la logique du premier ordre à la Toile">Table des matières</a> <a class="widget--select2__button widget--select2__button--disabled" aria-disabled="true" disabled><i class="fas fa-chevron-right"></i></a> </div> </div> <h1 class="content__list__item__title--content skiplink__parent"> <span lang="fr">Sciences des données : de la logique du premier ordre à la Toile</span> <span id="skiplink-main" class="skiplink__parent__anchor"></span> </h1> <p class="content__list__item__subtitle content__list__item__subtitle--content">Leçon inaugurale prononcée le jeudi 8 mars 2012. Chaire d’Informatique et sciences numériques</p> <div class="content__list__item__authors content__list__item__authors--content"> <a href="/cdf/person/507">Serge Abiteboul</a> </div> <div class="mb-3"> <h2 class="title--alt top">Note de l’éditeur</h2> <p class="ndlr">La chaire d’Informatique et sciences numériques du Collège de France reçoit le soutien de l’Institut national de recherche en informatique et en automatique (INRIA).<br/>Page du professeur sur le site du Collège de France et vidéo de la leçon inaugurale : <a href="http://www.college-de-france.fr/site/serge-abiteboul/index.htm">http://www.college-de-france.fr/site/serge-abiteboul/index.htm</a> </p> </div> <div id="anchor-completeplan" class="mb-3 scrollspy-target anchor--toc--section"> <button class="plan__header skiplink__parent" aria-label="Déplier le plan détaillé" data-translations="{"unfold_detailed_outline":"D\u00e9plier le plan d\u00e9taill\u00e9","fold_detailed_outline":"Replier le plan d\u00e9taill\u00e9"}"> <span id="skiplink-menu" class="skiplink__parent__anchor"></span> <span class="title--alt top m-0"> Plan détaillé </span> <span class="plan__header__chevron"> <i class="fas fa-chevron-down plan__header__chevron__icon"></i> </span> </button> <div class="plan--mobile hidden"> <div class="plan__body--mobile"> <a class="plan__body__item--mobile" href="#anchor-fulltext" title="Texte intégral"> Texte intégral </a><a class="plan__body__item--mobile lvl-1" href="#anchor-toc-1-1" title="1. Données, information et connaissances" > 1. Données, information et connaissances </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-2" title="Le stockage" > Le stockage </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-3" title="Mesurer les zettaoctets à la cuillère à café" > Mesurer les zettaoctets à la cuillère à café </a><a class="plan__body__item--mobile lvl-1" href="#anchor-toc-1-4" title="2. Les systèmes relationnels et la logique du premier ordre" > 2. Les systèmes relationnels et la logique du premier ordre </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-5" title="Le calcul et l’algèbre relationnels" > Le calcul et l’algèbre relationnels </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-6" title="L’optimisation de requête" > L’optimisation de requête </a><a class="plan__body__item--mobile lvl-3" href="#anchor-toc-1-7" title="Logique et complexité" > Logique et complexité </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-8" title="Transactions" > Transactions </a><a class="plan__body__item--mobile lvl-3" href="#anchor-toc-1-9" title="Parallélisme" > Parallélisme </a><a class="plan__body__item--mobile lvl-1" href="#anchor-toc-1-10" title="3. Les moteurs de recherche de la Toile " > 3. Les moteurs de recherche de la Toile </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-11" title="Un index de la Toile" > Un index de la Toile </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-12" title="Un point fixe et quelques algorithmes" > Un point fixe et quelques algorithmes </a><a class="plan__body__item--mobile lvl-3" href="#anchor-toc-1-13" title="La marche aléatoire" > La marche aléatoire </a><a class="plan__body__item--mobile lvl-3" href="#anchor-toc-1-14" title="Le point fixe" > Le point fixe </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-15" title="Et pour conclure sur les moteurs de recherche" > Et pour conclure sur les moteurs de recherche </a><a class="plan__body__item--mobile lvl-1" href="#anchor-toc-1-16" title="4. Réseaux et connaissances collectives " > 4. Réseaux et connaissances collectives </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-17" title="La notation" > La notation </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-18" title="L’évaluation de l’expertise" > L’évaluation de l’expertise </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-19" title="La recommandation" > La recommandation </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-20" title="La collaboration" > La collaboration </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-21" title="Le crowdsourcing" > Le <em>crowdsourcing</em></a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-22" title="Le pouvoir des masses d’internautes" > Le pouvoir des masses d’internautes </a><a class="plan__body__item--mobile lvl-1" href="#anchor-toc-1-23" title="5. La Toile des connaissances" > 5. La Toile des connaissances </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-24" title="Le Web sémantique" > Le Web sémantique </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-25" title="De l’acquisition de connaissances " > De l’acquisition de connaissances </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-26" title="Les services Web " > Les services Web </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-27" title="L’inférence" > L’inférence </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-28" title="Penser global" > Penser global </a><a class="plan__body__item--mobile lvl-1" href="#anchor-toc-1-29" title="Conclusion" > Conclusion </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-30" title="Éviter la noyade dans un océan de données" > Éviter la noyade dans un océan de données </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-31" title="Accès à l’information pour tous" > Accès à l’information pour tous </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-32" title="Démocratie ou pas" > Démocratie ou pas </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-33" title="Et la vie privée ?" > Et la vie privée ? </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-34" title="Pour des individus meilleurs ou pires ? " > Pour des individus meilleurs ou pires ? </a><a class="plan__body__item--mobile lvl-2" href="#anchor-toc-1-35" title="Et demain ?" > Et demain ? </a><a class="plan__body__item--mobile" href="#anchor-footnotes" title="Notes de bas de page"> Notes de bas de page </a><a class="plan__body__item--mobile" href="#anchor-persons" title="Auteur"> Auteur </a> </div> </div> </div> <hr class="separator" /> <div id="chapter-text-column"> <div id="chapter-text-column-mobile"> <h2 class="title--alt mt-3 top">Texte intégral</h2> <div id="anchor-fulltext" class="full_text full_text--main scrollspy-target anchor--toc"> <p class="texte"><span class="paranumber" id="para-1">1</span>Monsieur l’Administrateur,<br/>Mes chers collègues,<br/>Chers amis,</p><p class="texte"><span class="paranumber" id="para-2">2</span>En cette journée internationale de la femme, j’aimerais dédier ma leçon inaugurale à l’étudiante en informatique, à l’étudiante en mathématiques ou en sciences qui est si rare sur nos campus. Elle est assise au premier rang. Elle pianote peut-être un SMS en s’aidant de ses deux pouces. Elle est peut-être la « Petite Poucette » de Michel Serres, qui m’offre une transition parfaite pour situer l’objet de la leçon : </p><p class="epigraphe"><em>Je ne connais pas d’être vivant, de cellule, tissu, organe, individu et peut-être même espèce, dont on ne puisse pas dire qu’il stocke de l’information, qu’il traite de l’information, qu’il émet et qu’il reçoit de l’information.</em><br/>Michel Serres</p><p class="texte"><span class="paranumber" id="para-3">3</span>L’information stockée, traitée, échangée, est au cœur de l’activité des êtres vivants, des objets du monde, des associations humaines. Les systèmes informatiques, en nous aidant à gérer de l’information, représentée sous forme numérique, ont transformé nos vies en profondeur. Gérard Berry a déjà parlé dans sa leçon inaugurale de la numérisation de l’information<sup><a class="footnotecall" id="bodyftn1" href="#ftn1">1</a></sup>. Le sujet que j’ai le grand honneur d’aborder dans le cadre de la chaire d’Informatique et sciences numériques du Collège de France est la <em>gestion d’informations numériques par des systèmes informatiques</em>. J’espère que, dans la lignée de mes brillants prédécesseurs à cette chaire<a class="footnotecall" id="bodyftn2" href="#ftn2">2</a>, je saurai transmettre la richesse et la beauté de la science informatique, et participer ainsi à l’enseignement du « savoir en train de se faire ». </p><p class="texte"><span class="paranumber" id="para-4">4</span>Pour obtenir de l’information, nous pouvons interroger un <em>système de gestion de bases de données</em>. Pour ce faire, nous nous exprimons dans un langage informatique simple, peut-être graphique, peut-être même dans notre langue naturelle<sup><a class="footnotecall" id="bodyftn3" href="#ftn3">3</a></sup>. Le système traduit cette demande dans un langage formel. Par cela, nous entendons une syntaxe qui permet au système de préciser la demande de l’utilisateur, et une sémantique formelle qui donne un sens exact à cette syntaxe. La logique mathématique offre un tel langage formel. Nous évoquerons dans cette leçon les liens profonds entre ce que nous appellerons ici les <em>sciences des données</em> et la logique mathématique ou, plus précisément, la <em>logique du premier ordre</em>.</p><p class="texte"><span class="paranumber" id="para-5">5</span>Aujourd’hui, c’est sur la Toile que l’utilisateur cherche le plus souvent de l’information. Si l’anglais est prédominant en informatique, le français est parfois plus précis, plus élégant. Je préfère résolument <em>informatique</em> (pour « science et technologie de l’information ») à <em>computer science</em> (trop limitatif) et <em>courriel</em> à <em>email</em>. Je préfère aussi le mot <em>Toile</em> à l’anglicisme plus commun, <em>Web</em>, parce que dans <em>Toile</em>, la référence à la toile d’araignée étymologique est si joliment complétée par le clin d’œil à la toile du peintre ou à la toile de cinéma. Le mot <em>Toile</em> nous permet aussi de dépasser la vision trop restrictive d’un support particulier, le World Wide Web, pour envisager plus généralement un monde de contenus interconnectés à l’échelle de la planète. Il m’arrivera pourtant d’utiliser le mot <em>Web</em> dans des expressions comme « Web sémantique ».</p><p class="texte"><span class="paranumber" id="para-6">6</span>Nous considérerons les <em>systèmes d’information de la Toile </em>qui servent de point d’entrée vers des informations de nature globale. L’exemple le plus répandu d’un tel système est un moteur de recherche comme celui de Google, qui offre un index sur des milliards de documents de la Toile, et en quelque sorte permet de voir la Toile comme une base de données gigantesque. Un système de réseau social comme Facebook sert, lui, de point d’entrée vers les données personnelles de ses centaines de millions d’utilisateurs. </p><p class="texte"><span class="paranumber" id="para-7">7</span>Les systèmes d’information de la Toile, comme les systèmes de gestion de données centralisées, sont des médiateurs entre des individus intelligents peu soucieux de s’embarrasser de détails de programmation, et des objets physiques, comme les disques ou les clés USB. Nous nous intéressons donc à des systèmes intelligents qui gèrent de l’information, la comprennent et la mettent au service d’utilisateurs humains. Cette dernière phrase tient volontairement d’une vision anthropomorphique des systèmes informatiques. Nous interagissons avec des machines chaque jour un peu plus autonomes, des machines chaque jour de moins en moins distinguables des êtres humains. Si l’intelligence d’un système de gestion de bases de données est une étape modeste vers l’intelligence artificielle comme définie par Alan Turing, l’intelligence de la Toile est un questionnement récent, tant philosophique que scientifique. Nous parlerons dans cette leçon de l’apparition d’une connaissance collective nourrie de la mise en commun de grands volumes d’information, et nous imaginerons ce que pourra être la Toile de demain quand des millions, voire des milliards de machines interconnectées, raisonneront collectivement.</p><p class="texte"><span class="paranumber" id="para-8">8</span>Cette leçon est organisée de la manière suivante. En premier lieu, nous visiterons quelques notions fondamentales sur les données, l’information et les connaissances. Dans un deuxième temps, nous parlerons de deux des plus belles réussites de l’informatique du <span style="font-variant:small-caps;">xx</span><sup>e</sup> siècle :</p><ul class="texte"><li><p class="texte">l’une concerne les données, avec les systèmes de gestion de bases de données relationnelles ;</p></li><li><p class="texte">l’autre concerne l’information, avec les moteurs de recherche de la Toile.</p></li></ul><p class="texte"><span class="paranumber" id="para-9">9</span>Puis, nous considérerons deux grands défis du <span style="font-variant:small-caps;">xxi</span><sup>e</sup> siècle :</p><ul class="texte"><li><p class="texte">comment faire émerger des connaissances collectives de la Toile ;</p></li><li><p class="texte">comment passer à une « Toile des connaissances ».</p></li></ul><p class="epigraphe"><em><span lang="en">Look Dave, I can see you’re really upset about this. I honestly think you ought to sit down calmly, take a stress pill, and think things over</span></em><sup><em><a class="footnotecall" id="bodyftn4" href="#ftn4">4</a></em></sup><span lang="en">. <br/></span>HAL dans <em>2001 : A Space Odyssey</em>.</p><h1 class="texte" id="anchor-toc-1-1">1. Données, information et connaissances</h1><p class="texte"><span class="paranumber" id="para-10">10</span>Des mesures de température relevées chaque jour dans une station météo, ce sont des <em>données</em>. Une courbe donnant l’évolution dans le temps de la température moyenne dans un lieu, c’est une <em>information</em>. Le fait que la température sur Terre augmente en fonction de l’activité humaine, c’est une <em>connaissance</em>. Ces trois notions sont très proches les unes des autres. Grossièrement, voici le sens que nous leur donnerons<sup><a class="footnotecall" id="bodyftn5" href="#ftn5">5</a></sup> : </p><ul class="texte"><li><p class="texte">Une donnée est une description élémentaire, typiquement numérique pour nous, d’une réalité. C’est par exemple une observation ou une mesure.</p></li><li><p class="texte">À partir de données collectées, de l’information est obtenue en organisant ces données, en les structurant pour en dégager du sens.</p></li><li><p class="texte">En comprenant le sens de l’information, nous aboutissons à des connaissances, c’est-à-dire à des « faits » considérés comme vrais dans l’univers d’un locuteur, et à des « lois » (des règles logiques) de cet univers.</p></li></ul><p class="texte"><span class="paranumber" id="para-11">11</span>À la source de la représentation de données est le <em>bit</em>, une variable qui peut prendre la valeur 0 ou 1. Une <em>donnée</em> sera représentée par une séquence de bits. Par exemple, nous pouvons représenter la position d’un ascenseur dans un immeuble de six étages avec 3 bits : 000 pour le rez-de-chaussée, 001 pour le premier, etc., 110 pour le sixième (le nombre 6 en base 2). Nous représentons un caractère avec un octet, c’est-à-dire une séquence de 8 bits. (Il faut jusqu’à 4 octets par caractère pour certains alphabets et certains codages comme UTF-16.) Un texte peut être vu comme une suite d’octets. L’octet est la mesure élémentaire ; 10<sup>3</sup> octets forment un kilooctet ; 10<sup>6</sup> un mégaoctet ; 10<sup>9</sup> un gigaoctet ; 10<sup>12</sup> un téraoctet ; etc. </p><p class="texte"><span class="paranumber" id="para-12">12</span>Une suite de bits prise au hasard a peu de chance d’avoir un sens. Intéressons-nous plutôt aux données auxquelles nous pouvons donner un sens. Considérons par exemple une séquence de bits qui représenterait le tableau suivant :</p><figure class="fig--table"><table id="Table1" dir="ltr" class="table-transformed"><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Manon</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Imperial College</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Londres</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Pierre</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">ENS</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Cachan</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Jérémie</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Mines de Paris</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Paris</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Marie</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">ENS</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Cachan</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Myriam</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Paris 11</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Orsay</p></td></tr></table></figure><p class="texte"><span class="paranumber" id="para-13">13</span>Un extraterrestre ne comprendrait sans doute rien à cette séquence de bits. Mais un programme, un éditeur de texte, a pu l’analyser et présenter ce tableau sous une forme qui nous est familière. </p><p class="texte"><span class="paranumber" id="para-14">14</span><em>Des données à l’information.</em> Les entrées de ce tableau sont des chaînes de caractères. Pour l’instant, il s’agit de <em>données</em>. Maintenant, nous pouvons spécifier que la première colonne contient les prénoms de doctorants d’une école d’été à Cargèse en Corse, la deuxième, leur université, et la dernière, la ville qui héberge leur université. En recevant un sens, ces données sont devenues des <em>informations</em>. Nous noterons que l’absence de données aussi est informative. Par exemple, nous n’avons pas de ligne, « Philippe, ENS, Cachan ». C’est aussi une information ! </p><p class="texte"><span class="paranumber" id="para-15">15</span><em>De l’information aux connaissances. </em>Ces informations muent en connaissances quand nous les introduisons dans un univers logique. Chaque ligne devient une affirmation, par exemple « Manon, étudiante à l’Imperial College à Londres, a suivi cette école d’été ». Et si, par exemple, nous savons aussi que « cette table contient la liste complète de tous les doctorants de cette école d’été » et que « tous les doctorants de Cachan en informatique ont suivi cette école », nous pouvons en déduire que, soit Philippe n’est pas doctorant à Cachan, soit il n’est pas inscrit en informatique. </p><p class="texte"><span class="paranumber" id="para-16">16</span>Nous sommes passés des données aux informations, et des informations aux connaissances. Évidemment les frontières entre ces concepts sont floues. Ce monde que nous cherchons à modéliser avec des connaissances est complexe et nous échappe en partie. Par exemple, si certains pensent que Manon est étudiante à l’Imperial College, d’autres peuvent croire que cette affirmation est fausse.</p><h2 class="texte" id="anchor-toc-1-2">Le stockage</h2><p class="texte"><span class="paranumber" id="para-17">17</span>Plusieurs types de supports permettent de stocker des données numériques, notamment : la mémoire flash, le disque optique (qui inclut les CD et les DVD), le disque dur (ou disque magnétique), la bande magnétique. Ces supports procurent de gros volumes de stockage « persistant<sup><a class="footnotecall" id="bodyftn6" href="#ftn6">6</a></sup> » contrairement aux mémoires vives, ou RAM (Random Access Memory), faites de composants électroniques. </p><p class="texte"><span class="paranumber" id="para-18">18</span>Nous allons fournir quelques chiffres pour fixer les idées. L’ordinateur sur lequel j’écris ce texte a une mémoire vive de quatre gigas et à la place d’un disque, pour stocker ses données persistantes, il utilise une centaine de gigas de mémoire flash, une nouvelle technologie plus rapide que le disque dur et aussi plus chère. Cela nous donne l’occasion de mentionner que la technologie ne cesse de se complexifier. Les chiffres bougent très vite pour ce qui est des matériels informatiques ; les prix baissent, les vitesses d’accès ou de transfert croissent ; les volumes augmentent<sup><a class="footnotecall" id="bodyftn7" href="#ftn7">7</a></sup>. Dans quelques années, un lecteur de ce texte sourira des quatre gigas de mémoire. </p><p class="texte"><span class="paranumber" id="para-19">19</span>Il ne faut pas non plus oublier que les données que nous utilisons se trouvent de moins en moins stockées localement sur notre ordinateur mais, de plus en plus, sur des machines connectées quelque part sur le réseau. Par exemple, le document qui me sert de brouillon pour écrire ce texte est sur Google Docs, stocké sur le disque d’une machine inconnue, dont la localisation m’est elle aussi inconnue. De ces données, nous dirons qu’elles sont « en nuages » (<em>on the cloud</em>). Fonctionnellement, il nous faudra donc distinguer l’accès à des données sur un réseau local très rapide, qui prendra quelques millisecondes, et l’accès <em>via</em> Internet à des données peut-être à l’autre bout du monde, qui pourra prendre une seconde ou plus. </p><p class="texte"><span class="paranumber" id="para-20">20</span>Ces aspects techniques permettent de comprendre ce qu’il est possible de réaliser, comment et à quel prix. Nous les avons volontairement quelque peu simplifiés pour faciliter leur compréhension. Et quelques mots à l’attention de ceux qui aiment se réfugier derrière « je ne comprends rien à l’informatique ». La vision de l’informatique véhiculée par les médias souffre d’une trop grande fascination pour le matériel et la programmation. À mon avis, il importe peu de comprendre les détails du fonctionnement très complexe d’un processeur ou d’une carte graphique. Il est par contre essentiel de maîtriser les bases de l’algorithmique et de sa mécanique du raisonnement. Il n’est pas non plus nécessaire de savoir programmer (même si une expérience de programmation avec un langage comme CAML – Categorical Abstract Machine Language – peut faciliter la compréhension de l’algorithmique). Pour des questions de performance, il peut être utile de comprendre où l’information que nous utilisons est stockée, en mémoire, sur disque ou sur le réseau. Surtout, il est indispensable de comprendre le sens de cette information, comment elle est représentée, comment elle est organisée.</p><p class="texte"><span class="paranumber" id="para-21">21</span>Voici quelques chiffres à retenir : </p><figure class="fig--table"><table id="Table2" dir="ltr" class="table-transformed"><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Support de stockage</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Temps d’accès</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Taille</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Mémoire vive</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">microsecondes</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">gigaoctets (10<sup>9</sup>)</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Disque dur</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">millisecondes</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">quelques centaines de gigaoctets au téra</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Réseau local</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">millisecondes ou plus</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">téraoctets (10<sup>12</sup>)</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">La Toile</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">décisecondes voire secondes</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Virtuellement ∞</p></td></tr></table></figure><h2 class="texte" id="anchor-toc-1-3">Mesurer les zettaoctets à la cuillère à café</h2><p class="texte"><span class="paranumber" id="para-22">22</span>En alignant les bits, nous pouvons représenter des informations. Nous pouvons stocker de plus en plus d’informations pour les retrouver à la demande, telle une sauvegarde quasi illimitée de notre mémoire personnelle.</p><p class="texte"><span class="paranumber" id="para-23">23</span>Nous pouvons aller au-delà des dimensions déjà mentionnées en alignant les bits :</p><figure class="fig--table"><table id="Table3" dir="ltr" class="table-transformed"><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">kilo</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">méga</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">giga</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">téra</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">péta</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">exa</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">zetta</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">yotta</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">10<sup>3</sup></p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">10<sup>6</sup></p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">10<sup>9</sup></p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">10<sup>12</sup></p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">10<sup>15</sup></p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">10<sup>18</sup></p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">10<sup>21</sup></p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">10<sup>24</sup></p></td></tr></table></figure><p class="texte"><span class="paranumber" id="para-24">24</span>Discutons brièvement ces unités de mesures. Par exemple, cette leçon devrait peser quelques 100 000 octets, c’est-à-dire 100 kilooctets. Le kilooctet est une mesure « cool » car il est presque convenable de confondre 10<sup>3 </sup>= 1000 et 2<sup>10</sup> = 1024, ce qui permet de passer facilement du système décimal, le plus commun, au système binaire, cher aux informaticiens. Une dizaine de <em>Nocturnes</em> de Chopin sur mon téléphone prennent 75 mégaoctets. La vidéo de la remise de diplôme de ma fille et ses quelques gigaoctets nous conduisent aux frontières du gigantisme. Selon les chiffres de Michael Brodie<sup><a class="footnotecall" id="bodyftn8" href="#ftn8">8</a></sup>, tous les livres jamais écrits ne demanderaient que 200 téraoctets en texte brut et la quantité de données produites par le collisionneur de particules du CERN en une minute est de l’ordre d’une centaine de pétaoctets. Pour représenter toutes les phrases jamais prononcées, il faudrait quelques exaoctets. Enfin, le zettaoctet, c’est l’ordre de grandeur du trafic annuel sur Internet de nos jours, et c’est aussi celui du stockage disponible (en comptant tous les disques, bandes magnétiques, CD, DVD du monde entier) :</p><blockquote><p class="citation">1 000 000 000 000 000 000 000 octets !</p></blockquote><p class="texte"><span class="paranumber" id="para-25">25</span>Le vertige des puissances de 10 ! Nous créons chaque année plus d’information que nous ne pouvons en stocker. Dans cette débauche d’information, deux problèmes surgissent : </p><ol style="list-style-type:decimal;" class="texte"><li><p class="texte">Où trouver la bonne information dans cette masse ?</p></li><li><p class="texte">Comment choisir ce que l’on veut conserver ?</p></li></ol><p class="texte"><span class="paranumber" id="para-26">26</span>Bien sûr, il faudrait détailler, tenir compte de la nature de ce qui est stocké. La part des images grossit très vite, notamment à cause de la meilleure résolution des caméras de vidéo-surveillance. Mais nous assistons aussi à une forte augmentation des contenus riches en sémantique, directement utilisables comme les bases de données et les métadonnées. La forme de l’information dans la plupart des exemples que nous avons pris est très simple. De l’information beaucoup plus complexe peut aussi être représentée numériquement comme celle contenue dans l’ADN d’une cellule vivante. D’une certaine façon, déterminer l’information mise en jeu dans un objet quelconque, depuis une bactérie jusqu’à un phénomène comme le cours des actions, ou le mouvement des planètes, est une étape essentielle pour comprendre cet objet. Mais cela tient d’autres sciences que l’informatique, comme la biologie, les mathématiques financières, ou l’astronomie. Une fois cette information obtenue, des machines peuvent la stocker, l’échanger, l’analyser, etc. Nous atteignons les <em>sciences des données</em>.</p><p class="texte"><span class="paranumber" id="para-27">27</span>Après cette brève discussion sur la nature et le volume de l’information, tournons-nous vers les systèmes de bases de données qui ont véritablement fondé le domaine : les <em>systèmes relationnels</em>. </p><h1 class="texte" id="anchor-toc-1-4">2. Les systèmes relationnels et la logique du premier ordre</h1><p class="epigraphe"><em><span lang="en">Logic is the beginning of wisdom, not the end</span></em><sup><a class="footnotecall" id="bodyftn9" href="#ftn9">9</a></sup><span lang="en">.<br/></span>Mr. Spock, <em>Star Trek</em>.</p><p class="texte"><span class="paranumber" id="para-28">28</span>Nous parlerons dans cette partie de systèmes informatiques qui nous aident à gérer des données. Nous avons donc, d’un côté, un serveur de données quelque part sur la Toile, avec des disques et leurs pistes qui gardent précieusement des séquences de bits, des structures d’accès compliquées comme des index ou des arbres-B, des hiérarchies de mémoires avec leurs caches et, de l’autre, un utilisateur. Supposons que le serveur soit celui d’IMDb, qui gère une base de données sur le cinéma. Supposons que l’utilisateur, disons Alice, veuille savoir quels films ont été réalisés par Alfred Hitchcock. Pour ce faire, elle spécifie des mots-clés ou remplit les champs d’un formulaire proposé par IMDb. Sa question voyage depuis son navigateur jusqu’au serveur de données. Là, cette question est transformée en un programme, peut-être complexe, qui s’exécute pour obtenir la réponse. Ce programme, Alice n’a pas envie de l’écrire ; d’ailleurs, elle n’a pas à l’écrire.</p><p class="texte"><span class="paranumber" id="para-29">29</span>Le système élémentaire qui permet de gérer des données est un <em>système de fichiers</em>. Un fichier est une séquence de bits qui peut représenter une chanson, une photo, une vidéo, un courriel, une lettre, un roman, etc. Votre ordinateur personnel et votre téléphone stockent leurs données dans des systèmes de fichiers. Et parfois, quand vous ne savez plus où vous avez mis quelque chose, vous faites des « recherches » dans ces systèmes de fichiers. C’est rudimentaire. Nous verrons pourtant qu’un moteur de recherche de la Toile ne fait pas autre chose, sinon qu’il le fait sur un système de fichiers à l’échelle de la planète. Dans cette partie, nous parlerons de systèmes qui gèrent aussi des données mais qui sont bien plus sophistiqués que les systèmes de fichiers, les <em>systèmes de gestion de bases de données</em>. Ce sont des logiciels complexes, résultats de dizaines d’années de recherche et de développement. Ils permettent à des individus ou à des programmes d’exprimer des <em>requêtes</em> pour interroger des bases de données ou pour les modifier. Nous nous focaliserons ici sur les plus répandus de ces systèmes, les <em>systèmes relationnels</em>, parmi lesquels nous trouvons des logiciels commerciaux très répandus, comme celui d’Oracle, et des logiciels gratuits très utilisés, comme MySQL. </p><h2 class="texte" id="anchor-toc-1-5">Le calcul et l’algèbre relationnels</h2><p class="texte"><span class="paranumber" id="para-30">30</span>Un système de gestion de bases de données sert de médiateur entre des individus et des machines. Pour mieux s’adapter aux individus, il doit organiser et présenter les données de façon intuitive. Il doit aussi proposer un langage, pour exprimer des requêtes, facilement utilisable par des êtres humains. Ces exigences forment le point de départ du modèle relationnel<a class="footnotecall" id="bodyftn10" href="#ftn10">10</a> proposé par Ted Codd, un chercheur d’IBM, dans les années 1970. Des mathématiciens avaient développé à la fin du <span style="font-variant:small-caps;">xix</span><sup>e</sup> siècle (bien avant l’invention de l’informatique et des bases de données) la <em>logique du premier ordre</em>, pour formaliser le langage des mathématiques. Codd a eu l’idée d’adapter cette logique pour définir un modèle de gestion de données, le <em>modèle relationnel</em>. </p><figure class="fig--table"><p class="figure-title">Figure 1. Une base de données relationnelle</p><table id="Table4" dir="ltr" class="table-transformed"><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Film</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:none;border-bottom:1px solid #000000;" dir="ltr"/><td style="border-left:none;border-right:none;border-top:none;border-bottom:1px solid #000000;" dir="ltr"/><td style="border:none;" dir="ltr"/><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Séance</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:none;border-bottom:1px solid #000000;" dir="ltr"/><td style="border-left:none;border-right:none;border-top:none;border-bottom:1px solid #000000;" dir="ltr"/></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Titre</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Réalisateur</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Acteur</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:none;border-bottom:none;" dir="ltr"/><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Titre</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Salle</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">Heure</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Casablanca</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">M. Curtiz</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Humphrey Bogart</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:none;border-bottom:none;" dir="ltr"/><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Casablanca</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Lucernaire</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">19:00</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Casablanca</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">M. Curtiz</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Peter Lorre</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:none;border-bottom:none;" dir="ltr"/><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Casablanca</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Studio</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">20:00</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Les 400 coups</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">F. Truffaut</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Jean-Pierre Léaud</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:none;border-bottom:none;" dir="ltr"/><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Star Wars</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Sel</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">20:30</p></td></tr><tr><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Star Wars</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">G. Lucas</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Harrison Ford</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:none;border-bottom:none;" dir="ltr"/><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Stars Wars</p></td><td style="border-left:1px solid #000000;border-right:none;border-top:1px solid #000000;border-bottom:1px solid #000000;" dir="ltr"><p class="texte">Sel</p></td><td style="border:1px solid #000000;" dir="ltr"><p class="texte">22:15</p></td></tr></table></figure><p class="texte"><span class="paranumber" id="para-31">31</span>Dans le modèle relationnel, les données sont organisées en tableaux à deux dimensions que nous appellerons des <em>relations</em>. À la différence des mathématiciens, nous supposons les relations de taille finie. Comme illustration, nous utiliserons une base de données consistant en une relation <em>Film</em> et une relation <em>Séance</em> (figure 1). Une ligne de ces relations est appelée un <em>n-uplet </em>où <em>n</em> est le nombre de colonnes. Par exemple, 〈<em>Star Wars</em>, <em>Sel</em>, <em>22:15</em>〉<em> </em>est un 3-uplet, un triplet, dans la relation <em>Séance. </em>Les colonnes ont des noms, appelés <em>attributs, </em>comme <em>Titre.</em></p><p class="texte"><span class="paranumber" id="para-32">32</span>Les données sont interrogées en utilisant comme langage le calcul relationnel. Le calcul relationnel (très fortement inspiré de la logique du premier ordre) s’appuie sur des noms qui représentent des relations comme Film ou Séance, des entrées de ces relations comme « Star Wars », des variables comme <em>t</em>, <em>h</em>, et des symboles logiques, ⋀ (et), ⋁ (ou), ¬ (non), ⇒ (implique), ∃ (existe), ∀ (pour tout). Avec tout ça, des formules logiques peuvent être construites comme : </p><blockquote><p class="citation"><span lang="de">q</span><sub><span lang="de">HB</span></sub><span lang="de"> = ∃ </span><em><span lang="de">t</span></em><span lang="de">, </span><em><span lang="de">d</span></em><span lang="de"> ( </span><em><span lang="de">Film</span></em><span lang="de">(</span><em><span lang="de">t</span></em><span lang="de">, </span><em><span lang="de">r</span></em><span lang="de">, « Humphrey Bogart ») ⋀ </span><em><span lang="de">Séance</span></em><span lang="de">(</span><em><span lang="de">t</span></em><span lang="de">, </span><em><span lang="de">s</span></em><span lang="de">, </span><em><span lang="de">h</span></em><span lang="de">) )</span></p></blockquote><p class="texte"><span class="paranumber" id="para-33">33</span>Si cela vous paraît cryptique, en français, cela se lit : il existe un titre <em>t</em> et un réalisateur <em>r</em> tels que le n-uplet 〈 <em>t</em>, <em>r</em>, « Humphrey Bogart » 〉 se trouve dans la relation <em>Film</em>, et le n-uplet 〈 <em>t</em>, <em>s</em>, <em>h</em> 〉 dans <em>Séance</em>. Observez que <em>s </em>et <em>h</em> ne sont pas quantifiées dans la formule précédente ; nous dirons que ces deux variables sont <em>libres</em>. La formule q<sub>HB </sub>peut être vue comme une <em>requête du calcul relationnel. </em>Elle se lit alors : donnez-moi les salles <em>s</em> et les horaires <em>h</em>, s’il existe un réalisateur <em>r</em> et un titre <em>t</em> tels que... En d’autres termes, « Où et à quelle heure puis-je voir un film avec Humphrey Bogart ? ». Ce langage, le calcul relationnel, permet d’exprimer des questions dans une syntaxe qui évite les ambiguïtés de nos langues naturelles. Si elles pouvaient aimer, les machines aimeraient la simplicité, la précision du calcul relationnel. En pratique, elles utilisent le langage SQL (Structured Query Language) qui exprime différemment les mêmes questions. Par exemple, la question précédente s’exprime en SQL comme :</p><blockquote><p class="citation"><strong>select</strong> salle, heure<br/><strong>from</strong> Film, Séance<br/><strong>where</strong> Film.titre= Séance.titre <strong>and</strong> acteur= « Humphrey Bogart »</p></blockquote><p class="texte"><span class="paranumber" id="para-34">34</span>C’est presque compréhensible, non ? Et qu’Alice s’exprime en français ou qu’elle utilise une interface graphique, le système transforme sa question en requête SQL<sup><a class="footnotecall" id="bodyftn11" href="#ftn11">11</a></sup>.</p><p class="texte"><span class="paranumber" id="para-35">35</span>La question du calcul relationnel précédente (ou en SQL) précise bien ce qu’Alice demande. Cette question a un sens précis, une sémantique. Elle définit une réponse, un ensemble de n-uplets. Nous ne préciserons pas comment dans cette leçon. Ce que la question ne dit pas, c’est comment calculer la réponse. Pour le « comment », on utilise l’<em>algèbre relationnelle</em> introduite par Codd<em>.</em> Une étape importante consiste à transformer une question du calcul en une expression algébrique qui permet de calculer la réponse à cette question. </p><p class="texte"><span class="paranumber" id="para-36">36</span>L’algèbre relationnelle consiste en un petit nombre d’opérations de base qui, appliquées à des relations, produisent de nouvelles relations. Ces opérations peuvent être composées pour construire des expressions algébriques de plus en plus complexes. Pour répondre à la question qui nous sert d’exemple, il nous faudra trois opérations, la <em>jointure</em>, la <em>sélection</em> et la <em>projection</em>, que nous composerons dans l’expression suivante de l’algèbre relationnelle :</p><blockquote><p class="citation">E<sub>HB</sub> = Π<sub>salle,heure</sub> (Π<sub>titre</sub> (σ<sub>acteur = « Humphrey Bogart »</sub>(Film)) ⋈ Salle)</p></blockquote><figure><p class="figure-title">Figure 2. L’évaluation d’une requête algébrique</p><img src="/cdf/file/529/tei/img-1.png/download" alt="Image 10000000000005DC000005320645F6B5.png"/></figure><p class="texte"><span class="paranumber" id="para-37">37</span>Nous pourrons suivre l’évaluation de cette expression algébrique en figure 2. L’opération de sélection, dénotée σ, filtre une relation, ne gardant que les n-uplets satisfaisant une condition, ici <em>acteur = « Humphrey Bogart »</em>. L’opération de projection, dénotée Π, permet aussi de filtrer de l’information d’une relation mais cette fois en éliminant des colonnes. L’opération peut-être la plus exotique de l’algèbre, la jointure, dénotée ⋈, combine des n-uplets de deux relations. D’autres opérations non illustrées ici permettent de faire l’union et la différence entre deux relations ou de renommer des attributs. La puissance de l’algèbre relationnelle tient de la possibilité de composer ces opérations. C’est ce que nous avons fait dans l’expression algébrique E<sub>HB</sub> qui permet d’évaluer la réponse à la question q<sub>HB</sub>. </p><p class="texte"><span class="paranumber" id="para-38">38</span>Notre présentation est rapide mais il est important que le lecteur comprenne l’intérêt de l’algèbre. Il est relativement simple d’écrire un programme qui évalue la réponse à une question du calcul relationnel. Il est plus délicat d’obtenir un programme qui calcule cette réponse <em>efficacement</em>. L’algèbre relationnelle découpe le travail. Un programme particulier très efficace peut être utilisé pour chacune des opérations de l’algèbre ; le résultat est obtenu en composant ces programmes. L’efficacité provient notamment du fait que les opérations considèrent des ensembles de n-uplets plutôt que les n-uplets un à un. </p><p class="texte"><span class="paranumber" id="para-39">39</span>Codd a démontré le théorème suivant :</p><blockquote><p class="citation">Une question est exprimable en calcul relationnel si et seulement si elle peut être évaluée avec une expression de l’algèbre relationnelle, et il est simple de transformer une requête du calcul en une expression algébrique qui évalue cette requête.</p></blockquote><p class="texte"><span class="paranumber" id="para-40">40</span>Qu’avons-nous appris de Codd ? Pas grand-chose du point de vue des mathématiques. Le calcul relationnel est emprunté aux logiciens. Une algébrisation (légèrement différente) avait même déjà été proposée par Tarski. Mais d’un point de vue informatique, Codd a posé les bases de la médiation autour des données entre individus et machines. Grâce à son résultat, nous savons que nous pouvons exprimer une question en calcul relationnel, qu’un système peut traduire cette question en expression algébrique et calculer efficacement sa réponse. Pourtant, quand Codd proposa cette approche, la réaction des ingénieurs qui géraient alors de gros volumes de données et de grandes applications, fut unanime : « trop lent ! Ça ne passera pas à l’échelle ». Ils se trompaient. Pour traduire l’idée de Codd en une industrie de milliards de dollars, il manquait l’<em>optimisation de requête</em>. Après des années d’effort, les chercheurs sont parvenus à faire fonctionner les systèmes relationnels avec des temps de réponse acceptables. Avec ces systèmes, le développement d’applications gérant des données devenait beaucoup plus simple ; cela se traduisait par un accroissement considérable de la productivité des programmeurs d’applications gérant des gros volumes de données. </p><h2 class="texte" id="anchor-toc-1-6">L’optimisation de requête</h2><p class="texte"><span class="paranumber" id="para-41">41</span>Il existe une infinité d’expressions algébriques qui évaluent une même requête. Bien qu’elles soient syntaxiquement différentes, elles définissent la même question. D’un point de vue sémantique, elles sont <em>équivalentes</em>. Optimiser une requête consiste à la transformer en une autre requête qui donne les mêmes réponses, mais qui soit la moins coûteuse possible (typiquement en temps). D’un point de vue pratique, il nous faut choisir un <em>plan d’exécution</em>, c’est-à-dire une expression algébrique avec des précisions sur l’algorithme à utiliser pour évaluer chacune des opérations. Un plan d’exécution, c’est quasiment un programme pour calculer la réponse. Un premier problème est que l’<em>espace de recherche</em>, c’est-à-dire l’espace dans lequel nous voulons trouver le plan d’exécution, est potentiellement gigantesque. Pour éviter de le parcourir entièrement, nous allons utiliser des <em>heuristiques</em>, c’est-à-dire des méthodes qui, si elles ne garantissent pas de trouver le plan optimal, donnent assez rapidement des plans satisfaisants. Ces heuristiques utilisent souvent des règles de bon sens comme « il faut réaliser les sélections le plus tôt possible ». L’autre difficulté est que pour choisir le plan le moins chronophage, l’optimiseur (c’est-à-dire le programme en charge de l’optimisation) doit être capable d’estimer le coût de chaque plan candidat, et c’est une tâche complexe à laquelle le système ne peut se permettre d’accorder trop de ressources. L’optimiseur fait donc « de son mieux ». Et typiquement, les optimiseurs de systèmes comme Oracle ou DB2 font des merveilles sur des requêtes simples. C’est bien moins glorieux pour les requêtes complexes, par exemple celles qui mettent en jeu des quantificateurs universels comme la question : quels sont les acteurs qui n’ont joué que dans des comédies ? Heureusement, en pratique, la plupart des questions posées sont simples. </p><p class="texte"><span class="paranumber" id="para-42">42</span>Sous-jacente à la discussion sur l’optimisation de requête est la question de la difficulté d’obtenir une certaine information. Nous rencontrons la notion de « complexité ». Depuis Gödel, nous savons qu’il est des propositions qui ne peuvent être ni démontrées ni réfutées, qu’il est des problèmes qui ne peuvent être résolus. Cette notion d’indécidabilité commence péniblement à arriver jusqu’au grand public. Ce même public ne voit dans le fait qu’une requête prend plus ou moins longtemps que des raisons purement techniques. Évidemment, le temps de calcul dépend de la puissance du serveur, de la vitesse du disque ou de la qualité de l’optimiseur. Mais au-delà de tels aspects, il est des tâches qui demandent <em>intrinsèquement</em> plus de temps que d’autres. Par exemple, nous pouvons afficher à l’écran le gogol, nombre consistant en un 1 suivi de 100 zéros, en quelques fractions de secondes, mais nous ne nous amuserions pas à afficher tous les nombres de 1 au gogol (1, 2, … 10<sup>100</sup>). Cela prendrait trop de temps. Même parmi les problèmes dont la réponse est courte (par exemple, « oui » ou « non »), il en est qui, bien que décidables, sont intrinsèquement bien plus complexes que d’autres ; il en est même que nous ne savons pas résoudre <em>en temps raisonnable</em>. Parfois, cette difficulté trouve même son utilité. Le système cryptographique RSA repose sur le fait que nous ne savons pas factoriser (en général) un très grand entier en nombres premiers, en un temps raisonnable, et qu’il est donc très difficile de décrypter un message sans en connaître la clé secrète. </p><p class="texte"><span class="paranumber" id="para-43">43</span>La complexité est un aspect particulièrement important pour le traitement de gros volumes de données. Pour une requête particulière, nous voulons savoir :</p><ul class="texte"><li><p class="texte">quel temps il faut pour la réaliser (complexité en temps) ;</p></li><li><p class="texte">quel espace-disque, ou quelle mémoire, est nécessaire (complexité en espace). </p></li></ul><p class="texte"><span class="paranumber" id="para-44">44</span>Évidemment ces quantités dépendent de la taille de la base de données. Si la requête prend un temps <em>t</em> et que nous doublons la taille <em>n</em> de nos données, nous faut-il attendre le même temps (temps constant), le double de temps (temps linéaire en <em>n</em>), ou est-ce que le temps grandit de manière polynomiale (en <em>n</em><sup>k</sup> où <em>n</em> est la taille des données) voire exponentielle (en <em>k</em><sup>n</sup>) ? Ce n’est pas anodin : sur de gros volumes de données, une complexité en temps <em>n</em><sup>k</sup> exigera une grosse puissance de calcul, et une complexité en <em>k</em><sup>n</sup> sera rédhibitoire. </p><p class="texte"><span class="paranumber" id="para-45">45</span>Deux remarques nous permettent de préciser cette notion de complexité : </p><ol style="list-style-type:decimal;" class="texte"><li><p class="texte">la complexité dans les données. En informatique, la complexité se mesure par la taille du problème, ici ce serait la taille des données plus la taille de la requête. Mais les requêtes étant typiquement nettement plus petites, il est bien plus instructif de ne considérer la complexité qu’en fonction de la taille des données. Nous parlerons de <em>complexité</em> dans les <em>données</em>.</p></li><li><p class="texte">les bornes inférieure et supérieure. Si un programme répond à une requête en temps <em>n</em><sup>2</sup> dans la taille <em>n </em>des données, cela prouve seulement qu’il est possible d’y répondre en temps <em>n</em><sup>2</sup>, ce qui donne une borne supérieure. Peut-être existe-t-il un autre programme qui calcule la réponse plus rapidement, peut-être en temps constant. Si nous pouvons montrer qu’un temps <em>n</em>⨉log(<em>n</em>) au minimum est nécessaire, cela donne une borne inférieure. Par exemple, pour calculer le nombre de n-uplets de la jointure entre deux relations, <em>n</em>⨉log(<em>n</em>) se trouve être à la fois une borne inférieure et supérieure<sup><a class="footnotecall" id="bodyftn12" href="#ftn12">12</a></sup>. </p></li></ol><p class="texte"><span class="paranumber" id="para-46">46</span>De nombreuses <em>classes de complexité</em> ont été étudiées. Intuitivement, une classe de complexité regroupe tous les problèmes qui peuvent être résolus sans dépasser certaines ressources disponibles, typiquement le temps ou l’espace. Par exemple, vous avez peut-être entendu parler de la classe <em>P</em>, temps polynomial. Il s’agit de l’ensemble des problèmes qu’il est possible de résoudre dans un temps <em>n</em><sup>k</sup> où <em>n</em> est la taille des données et <em>k</em> un entier arbitraire. Au-delà de <em>P</em>, nous atteignons les temps <em>NP</em> (non-déterministe polynomial<sup><a class="footnotecall" id="bodyftn13" href="#ftn13">13</a></sup>) et <em>EXPTIME </em>(temps exponentiel), des temps prohibitifs ? Pourtant, il faut relativiser. Les systèmes informatiques résolvent régulièrement des problèmes parmi les plus complexes de <em>NP</em>. Et, <em>a contrario</em>, pour 1,5 téraoctets de données, <em>n</em><sup>3 </sup>est encore aujourd’hui hors d’atteinte, même en disposant de tous les ordinateurs de la planète. </p><p class="texte"><span class="paranumber" id="para-47">47</span>Avant de poursuivre sur d’autres aspects du modèle relationnel, interrogeons-nous sur les origines de l’énorme succès des systèmes relationnels :</p><ol style="list-style-type:decimal;" class="texte"><li><p class="texte">Les requêtes sont fondées sur le calcul relationnel, un langage logique, simple et compréhensible pour des humains surtout dans des variantes comme SQL. </p></li><li><p class="texte">Une requête du calcul relationnel est facilement traduisible en une expression de l’algèbre relationnelle simple à évaluer pour des machines. </p></li><li><p class="texte">Il est possible d’optimiser l’évaluation d’expressions de l’algèbre relationnelle car cette algèbre n’offre qu’un modèle de calcul limité. </p></li><li><p class="texte">Enfin, nous verrons que pour ce langage relativement limité, le parallélisme permet de passer à l’échelle de très grandes bases de données. </p></li></ol><p class="texte"><span class="paranumber" id="para-48">48</span>Pour insister sur les deux derniers points qui sont essentiels, nous pourrions choisir d’attribuer aux bases de données le slogan : « ici on ne fait que des choses simples mais on les fait vite. » Nous allons voir que nous les faisons aussi en lien étroit avec la logique. </p><h3 class="texte" id="anchor-toc-1-7">Logique et complexité</h3><p class="texte"><span class="paranumber" id="para-49">49</span>Il est des liens profonds entre des classes de complexité et des classes de problèmes exprimables dans des logiques. Ronald Fagin a par exemple montré que <em>NP</em> coïncidait avec « la logique existentielle du second ordre » (dans laquelle une variable représente un ensemble). Nous allons mentionner certains de ces liens. Même si nous allons essayer de gommer au maximum les détails techniques, cette discussion pourra paraître un peu ardue. Nous encourageons pourtant le lecteur à essayer de saisir la beauté de certains ponts entre la logique, que nous voyons ici comme le langage permettant aux êtres humains de dialoguer avec des machines, et les calculs que ces machines réalisent mécaniquement avec des ressources limitées. </p><p class="texte"><span class="paranumber" id="para-50">50</span>Les requêtes relationnelles sont évaluables en <em>P</em>. Cela suggère la question suivante : est-il possible d’exprimer avec le calcul relationnel tout ce qu’une machine pourrait calculer en temps polynomial ? Il se trouve que non ! La requête suivante est dans <em>P</em> mais n’est pas exprimable dans le calcul relationnel : étant donné un graphe <em>G</em>, et deux points <em>a</em>, <em>f </em>de ce graphe, existe-t-il un chemin de <em>a</em> à <em>f</em> ? Aussi surprenant que cela puisse paraître, si nous pouvons avec le calcul relationnel demander s’il existe un chemin de longueur 3 ou même <em>k</em>, pour un <em>k</em> fixé, il faudrait pour un chemin de longueur arbitraire une disjonction infinie : un chemin de longueur 1 ou 2 ou 3, etc. Pour corriger ce problème, nous pouvons ajouter au langage un mécanisme qui permette de réitérer une requête du calcul relationnel jusqu’à un point fixe. Par exemple, pour la requête précédente, partant de l’ensemble <em>T = </em>{ <em>a</em> }, nous <em>ajoutons</em> à <em>T </em>les points que nous pouvons joindre à partir de <em>T</em> en suivant un arc de <em>G</em>, et ce tant que <em>T</em> grandit. Quand le point fixe est atteint, il ne reste plus qu’à vérifier si <em>f</em> est dans <em>T.</em> </p><p class="texte"><span class="paranumber" id="para-51">51</span>Le langage ainsi obtenu est appelé <em>fixpoint</em>. Comme les programmes ne font qu’ajouter des n-uplets dans des relations et n’inventent jamais de valeurs, la complexité reste dans <em>P</em>. Le langage obtenu, en autorisant les programmes à supprimer des n-uplets, est appelé <em>while.</em> Sa complexité est <em>pspace</em> : il peut être réalisé en utilisant un espace polynomial dans la taille des données. Un tel programme peut entrer dans une boucle, ne jamais s’arrêter<sup><a class="footnotecall" id="bodyftn14" href="#ftn14">14</a></sup>, et donc ne jamais atteindre de point fixe. Ces langages permettent d’exprimer des requêtes très complexes. Pourtant, belle déception : des requêtes hyper-simples ne sont pas exprimables en <em>fixpoint</em>, pas même en <em>while</em>. C’est le cas par exemple de la requête : est-ce que le graphe <em>G</em> a un nombre pair de nœuds ? J’ai longtemps travaillé dans ce domaine notamment avec mon collègue Victor Vianu (University of California, San Diego). Nous avons caractérisé ce qui peut être calculé avec ces langages. Nous avons notamment prouvé<sup><a class="footnotecall" id="bodyftn15" href="#ftn15">15</a></sup> que <em>fixpoint</em> était égal à <em>while</em> si et seulement si <em>P</em> était égal à <em>pspace</em>, établissant ainsi un pont entre des logiques et des classes de complexité<sup><a class="footnotecall" id="bodyftn16" href="#ftn16">16</a></sup>.</p><p class="texte"><span class="paranumber" id="para-52">52</span>Notons en passant que si <em>pspace</em> « a l’air » bien plus puissant que <em>P</em>, nous ne savons pas s’ils sont différents. Nous ne savons d’ailleurs pas non plus si <em>P </em><em>≠</em><em> NP</em>, le problème ouvert le plus célèbre de l’informatique. Si nos connaissances progressent en théorie de la complexité, de nombreux défis persistent, fascinants et difficiles. Et pour conclure cette discussion sur les liens entre logique et complexité, nous mentionnerons un autre problème ouvert : obtenir une logique qui capture exactement les requêtes dans <em>P, </em>intuitivement les requêtes auxquelles il est possible de répondre dans un temps raisonnable. En pratique, cela reviendrait à disposer d’un langage qui ne permettrait d’exprimer des requêtes que dans <em>P</em>, mais qui permettrait d’exprimer toutes les requêtes de <em>P</em>. S’il est probable qu’un tel langage serait de fait peu utilisable en pratique, le problème est si beau qui relie le logiquement exprimable et le rapidement calculable.</p><p class="texte"><span class="paranumber" id="para-53">53</span>Et pour conclure cette partie, nous allons discuter deux aspects essentiels de la gestion de données : les transactions et le parallélisme.</p><h2 class="texte" id="anchor-toc-1-8">Transactions</h2><p class="epigraphe"><em><span lang="en">To serve and protect data</span></em><sup><a class="footnotecall" id="bodyftn17" href="#ftn17">17</a></sup><span lang="en">.<br/>Anonyme</span></p><p class="texte"><span class="paranumber" id="para-54">54</span>La modernisation des chaînes de fabrication a été principalement causée, dans un premier temps, par l’électronique et l’automatique. Avant de s’imposer aussi dans la fabrication, l’informatique a profondément pénétré l’industrie en modifiant radicalement la manière dont des transactions, comme les commandes ou la paye, étaient gérées de manière automatique. Une transaction informatisée est la forme dématérialisée d’un contrat. Son coût peut se trouver incomparablement plus faible que celui d’une transaction réelle mettant en jeu des déplacements de personnes sur des échelles de temps bien plus longues. Avec des fonctionnalités considérablement élargies par le recours à l’informatique, les transactions se retrouvent au cœur de nombreuses applications qui ont largement contribué à populariser les systèmes relationnels comme, par exemple, les applications bancaires.</p><p class="texte"><span class="paranumber" id="para-55">55</span>Les systèmes relationnels répondent aux besoins des transactions en supportant la notion de <em>transaction relationnelle</em>. Une transaction relationnelle garantit qu’une séquence d’opérations se réalise correctement, par exemple en empêchant qu’une somme d’argent ne s’évanouisse dans la nature (avec un compte en banque débité sans qu’un autre ne soit crédité). Même l’occurrence d’une panne<sup><a class="footnotecall" id="bodyftn18" href="#ftn18">18</a></sup> ne doit pas pouvoir conduire à une exécution incorrecte. Il nous faut donc formaliser la notion d’« exécution correcte ». Évidemment, il serait impossible de le faire précisément s’il fallait tenir compte des millions de choses que font de tels systèmes. Mais l’informatique, comme les mathématiques, dispose d’un outil fantastique : l’« abstraction ». Nous pouvons considérer ce que fait un système relationnel sous l’angle des transactions relationnelles et des modifications qu’elles apportent aux données, <em>en faisant abstraction</em> de toutes les autres tâches qu’il réalise. Il devient alors possible de définir formellement la notion d’exécution correcte. </p><p class="texte"><span class="paranumber" id="para-56">56</span>Nous pouvons mentionner d’autres tâches que les systèmes relationnels accomplissent à côté de l’évaluation de requêtes et de la gestion de transactions relationnelles. Ils gèrent également :</p><ul class="texte"><li><p class="texte">les contraintes d’intégrité (telles que « tout responsable de projet doit être enregistré dans la base des personnels »), </p></li><li><p class="texte">les déclencheurs ou <em>triggers</em> (tels que « si quelqu’un modifie la liste des utilisateurs, envoyer un message au responsable de la sécurité »), </p></li><li><p class="texte">les droits des utilisateurs (pour contrôler qui a le droit de lire ou de modifier quoi), </p></li><li><p class="texte">les vues (pour s’adapter aux besoins d’utilisateurs particuliers), </p></li><li><p class="texte">l’archivage (pour pouvoir garantir la pérennité des données), </p></li><li><p class="texte">le nettoyage des données (par exemple pour éliminer les doublons, les incohérences). </p></li></ul><h3 class="texte" id="anchor-toc-1-9">Parallélisme</h3><p class="texte"><span class="paranumber" id="para-57">57</span>Pour gérer de gros volumes de données, l’utilisation du parallélisme s’avère essentiel. De plus en plus, les machines sont multi-processeurs. Mais nous insisterons ici surtout sur l’utilisation de plusieurs machines travaillant simultanément sur une tâche commune. Ce type d’approches est particulièrement fondamental pour la Toile, qui met en jeu des volumes considérables d’information :</p><ul class="texte"><li><p class="texte">parallélisme entre peut-être les dizaines, les centaines, voire les milliers de serveurs d’une « grappe<sup><a class="footnotecall" id="bodyftn19" href="#ftn19">19</a></sup> » ;</p></li><li><p class="texte">parallélisme entre les millions de serveurs de la Toile qui fonctionnent indépendamment mais interagissent en permanence.</p></li></ul><p class="texte"><span class="paranumber" id="para-58">58</span>Pour conclure cette partie, je donnerai deux exemples en guise d’illustration, afin de faire sentir au lecteur la puissance du parallélisme : </p><ul class="texte"><li><p class="texte">Plutôt que de regrouper les comptes de ses clients dans un centre informatique unique, une entreprise peut choisir de les laisser gérer par ses centres régionaux. Regrouper les données sur une machine unique, avec des performances comparables, exigerait un serveur très sophistiqué, donc plus cher. Notons aussi qu’une organisation distribuée s’accorde mieux à un <em>management</em> plus décentralisé de l’entreprise. </p></li><li><p class="texte">Deux types d’organisations sont possibles pour la diffusion de films. Dans une première, chaque film est conservé sur un serveur unique. Si le nombre de clients augmente ou si un film est trop populaire, le serveur est vite saturé. Dans une autre organisation, une architecture <em>pair-à-pair</em>, chaque machine est un <em>pair</em>, c’est-à-dire à la fois serveur et client. Si un pair demande un film, il peut stocker ce film et le transmettre plus tard à d’autres. Plus un film est populaire, plus il devient disponible sur un grand nombre de machines, et plus son téléchargement devient facile et rapide. </p></li></ul><p class="texte"><span class="paranumber" id="para-59">59</span>Nous avons considéré dans cette partie la gestion de données dans des systèmes relationnels. Nous allons maintenant nous intéresser aux systèmes d’information de la Toile, et, pour commencer, aux plus répandus d’entre eux, les moteurs de recherche. </p><h1 class="texte" id="anchor-toc-1-10">3. Les moteurs de recherche de la Toile </h1><p class="epigraphe"><em>Internet : on ne sait pas ce qu’on y cherche mais on trouve tout ce qu’on ne cherche pas.</em><br/>Anne Roumanoff</p><p class="texte"><span class="paranumber" id="para-60">60</span>Le World Wide Web, introduit par Tim Berners-Lee et Robert Cailliau vers 1990, s’appuie sur des documents hypermédia. C’est la Toile à laquelle nous nous sommes si rapidement habitués. L’information est en langue naturelle et les textes vaguement structurés avec les balises HTML pour, par exemple, des titres ou des énumérations. Des ancres sur lesquelles l’internaute peut cliquer conduisent à d’autres pages HTML, mais aussi à des images, de la musique, des vidéos. Dans cette partie, nous allons parler d’un des plus beaux succès de la Toile, le <em>moteur de recherche</em>. Le moteur de recherche de la Toile nous permet de fuir la navigation fastidieuse sur le graphe des pages et le monde de l’hypertexte pour nous plonger dans une bibliothèque numérique universelle. Nous allons expliquer comment fonctionne un tel moteur. Le lecteur pourra trouver plus de détails dans l’article historique de Sergeï Brin et Lawrence Page<sup><a class="footnotecall" id="bodyftn20" href="#ftn20">20</a></sup> ou dans notre ouvrage récent<sup><a class="footnotecall" id="bodyftn21" href="#ftn21">21</a></sup>.</p><p class="texte"><span class="paranumber" id="para-61">61</span>Le moteur de recherche s’intéresse à une vision de la Toile comme bibliothèque universelle. L’internaute cherche une information. Même si la Toile n’a sûrement pas de réponses à toutes ses questions, cette information se trouve peut-être dans les masses d’informations et de connaissances véritablement extraordinaires réunies. Tels des enfants, nous nous émerveillons devant les dizaines de milliards de documents de la Toile. Mais un enfant apprend, depuis son plus jeune âge, à évaluer, classer, filtrer la masse considérable d’informations qu’il rencontre. Et nous ? Si le moteur de recherche ne nous aidait pas à nous focaliser sur un petit nombre de pages, que ferions-nous ? L’exploit technique, c’est de retrouver en un instant, grâce à son index, les pages de la Toile qui hébergent les mots demandés. La magie, c’est de proposer parmi les dizaines, voire les centaines de millions de pages possibles, les quelques pages qui contiennent si souvent ce que l’internaute recherche. Examinons tour à tour ces deux facettes des moteurs de recherche.</p><h2 class="texte" id="anchor-toc-1-11">Un index de la Toile</h2><p class="epigraphe"><em>La mission de Google : organiser les informations à l’échelle mondiale dans le but de les rendre accessibles et utiles à tous</em>.<br/>Google</p><p class="texte"><span class="paranumber" id="para-62">62</span>Un index de la Toile associe à chaque mot la liste des pages qui contiennent ce mot. Par exemple, une entrée dans cet index serait :</p><blockquote><p class="citation">Casablanca → http://www.imdb.com/title/tt0034583/, http://films.com/Bogart/,...</p></blockquote><p class="paragraphesansretrait">qui indique que le mot « Casablanca » est présent notamment dans ces pages des sites IMDb et films.com. Si vous donnez au moteur de recherche plusieurs mots comme « Casablanca Bogart Bergman », il calculera la liste des pages de la Toile qui contiennent <em>tous</em> ces mots. </p><p class="texte"><span class="paranumber" id="para-63">63</span>Une sérieuse difficulté est la taille de cet index : des dizaines de téraoctets de données pour quelques milliards de pages. Un serveur d’un tel index rencontre deux problèmes de passage à l’échelle :</p><ol style="list-style-type:decimal;" class="texte"><li><p class="texte">Pour indexer plus de pages, le serveur a besoin de plus en plus de stockage pour garder l’index, et chaque requête devient de plus en plus coûteuse à évaluer.</p></li><li><p class="texte">Si le nombre d’utilisateurs croît, le serveur reçoit de plus en plus de requêtes.</p></li></ol><p class="texte"><span class="paranumber" id="para-64">64</span>Dans les deux cas, le serveur est vite submergé. Pour résoudre ce problème, nous allons utiliser le parallélisme et une technique fondamentale de l’informatique, la technique du <em>hachage</em>. </p><p class="texte"><span class="paranumber" id="para-65">65</span>Pour illustrer la technique, nous allons utiliser <em>K</em> =10 machines <em>M</em><sub>1</sub>, …, <em>M</em><sub>10</sub> et une fonction <em>H</em> qui, appliquée à un mot, retourne un entier choisi aléatoirement entre 1 et 10 (et qui retourne, pour un mot donné<em>,</em> à chaque fois le même entier). Cette fonction est appelée <em>fonction de hachage</em>. La responsabilité d’un mot <em>w</em> est donnée à la machine <em>H</em>(<em>w</em>). Supposons qu’un <em>crawler</em> (un programme qui parcourt la Toile en quête de pages) découvre le mot « France » sur une page d’URL <em>p. </em>L’entrée de l’index, qui dit que la page <em>p </em>contient ce mot, est stockée sur la machine <em>H</em>(« France »), disons <em>M</em><sub>7</sub>. Les données de l’index sont donc partagées relativement équitablement entre les dix machines ce qui résout le premier problème. Supposons maintenant que quelqu’un veuille les données correspondant au mot « France », il interroge la machine <em>M</em><sub>7</sub>. Les requêtes sont donc elles-aussi partagées relativement équitablement entre les dix machines, ce qui résout le second problème. Il nous faut évidemment réaliser un index sur chaque machine. Typiquement, nous pouvons là aussi utiliser une technique de hachage, centralisé cette fois. </p><p class="texte"><span class="paranumber" id="para-66">66</span>Maintenant si la taille des données que nous voulons indexer ou le nombre de clients grandissent, il suffit d’ajouter des machines. Par exemple, Google utilise des milliers de machines dans des « fermes<sup><a class="footnotecall" id="bodyftn22" href="#ftn22">22</a></sup> » et disperse ses fermes aux quatre coins du monde. Le parallélisme nous a permis le passage à l’échelle. Vous avez dit brillant ?</p><p class="texte"><span class="paranumber" id="para-67">67</span>Pourquoi est-ce que cela marche ? Grâce au parallélisme. De manière générale, pouvons-nous prendre n’importe quel algorithme et l’accélérer à volonté en utilisant plus de machines ? La réponse est non ! Tous les problèmes ne sont pas aussi aisément parallélisables. Il se trouve que la gestion d’index est un problème très simple, très parallélisable<sup><a class="footnotecall" id="bodyftn23" href="#ftn23">23</a></sup> (<em>embarrassingly parallel</em>). Nous pouvons donc sans frémir envisager d’indexer de plus en plus de pages, des dizaines de milliards ou plus. </p><h2 class="texte" id="anchor-toc-1-12">Un point fixe et quelques algorithmes</h2><p class="epigraphe"><span lang="en">Playboy:</span><em><span lang="en"> Is your company motto really “Don’t be evil”?</span></em><span lang="en"> Brin: </span><em><span lang="en">Yes, it’s real.</span></em><span lang="en"> Playboy:</span><em><span lang="en"> Is it a written code?</span></em><span lang="en"> Brin:</span><em><span lang="en"> Yes. We have other rules, too.</span></em><span lang="en"> Page:</span><em><span lang="en"> We allow dogs, for example</span></em><span lang="en"><a class="footnotecall" id="bodyftn24" href="#ftn24">24</a></span><span lang="en">. <br/></span>S. Brin et L. Page, fondateurs de Google. <br/>Interview dans le magazine <em>Playboy</em>, 2004. </p><p class="texte"><span class="paranumber" id="para-68">68</span>Le cœur du problème reste maintenant de choisir parmi les millions de pages qui contiennent les mots de la requête. C’est essentiel car un utilisateur ira rarement au-delà des dix ou vingt premiers résultats qui lui seront proposés. Au départ, les moteurs de recherche comme Alta Vista utilisaient, pour classer les pages, des techniques basées uniquement sur leurs contenus, comme dans les bibliothèques numériques traditionnelles. Une page était jugée plus intéressante si le terme apparaissait dans un titre, ou en caractère gras. Ces moteurs utilisaient des mesures statistiques du type TF-IDF (Term Frequency-Inverse Document Frequency) qui évaluent l’importance d’un terme dans un document relativement à un corpus de documents. Plus le terme est répété dans le document plus il « pèse ». Et, plus le terme est rare dans le corpus, plus il pèse. Ce genre de technique, qui marche bien sur de petits corpus, s’est avéré assez décevant pour la Toile. </p><p class="texte"><span class="paranumber" id="para-69">69</span>Les jeunes créateurs de Google ont eu l’idée de baser l’ordre des pages sélectionnées sur une connaissance collective présente de manière implicite dans la masse des pages. Plus précisément, ils ont utilisé une technique classique en mathématiques, la marche aléatoire. C’est cette idée, inspirée de travaux antérieurs, notamment ceux de Jon Kleinberg<sup><a class="footnotecall" id="bodyftn25" href="#ftn25">25</a></sup>, qui est à l’origine de l’algorithme PageRank de Google, et du succès industriel de cette société, l’un des plus étonnants de l’histoire de l’humanité. </p><h3 class="texte" id="anchor-toc-1-13">La marche aléatoire</h3><p class="texte"><span class="paranumber" id="para-70">70</span>Imaginez un « surfeur de la Toile ». Il part d’une page, disons la page <em>www.inria.fr</em>. Ensuite, il se balade sur la Toile en choisissant à chaque étape, au hasard, un des liens de la page, et il clique sur ce lien. Si la page n’a pas de lien, il choisit aléatoirement une page n’importe où sur la Toile. Et il continue encore et encore, pour toujours. Quelle est, à l’infini, la probabilité de se trouver sur une page précise ? C’est ce que nous définirons comme la <em>popularité</em> de cette page. Intuitivement, si une page est populaire (comme la page <em>www.lemonde.fr</em>), de nombreuses pages la référencent et la probabilité de se retrouver sur cette page est bien plus grande que de se retrouver sur une page d’une bloggeuse inconnue (comme Alice). S’agit-il <em>a priori</em> d’une définition abstraite, d’un joli concept de mathématiques totalement inutile ? Non. Car il se trouve qu’en pratique cette popularité correspond assez bien aux attentes des internautes. </p><p class="texte"><span class="paranumber" id="para-71">71</span>Reste à calculer cette popularité. Pour cela, nous allons la mettre en équation. Supposons que nous indexions dix milliards de pages. Nous les numérotons de 1 à <em>N</em> = dix milliards. Dans une approche classique en mathématiques, imaginons que nous connaissons déjà cette popularité. Nous disposons donc d’un vecteur <em>pop</em>, où pour chaque page <em>i</em>, <em>pop</em>[<em>i</em>] est la popularité de la page. (C’est la probabilité de se trouver sur cette page ; notons que Σ<sub><em>i</em></sub><sub> =1 à </sub><sub><em>N</em></sub> <em>pop</em>[<em>i</em>] = 1.) Chaque page distribue disons 90 % de sa popularité équitablement entre toutes les pages vers laquelle elle pointe, et les 10 % qui restent entre toutes les pages indexées. Si une page est un cul-de-sac (elle ne conduit nulle part), elle partage toute sa popularité entre toutes les pages indexées. En ignorant quelques détails, cela nous conduit à une matrice Θ qui capture ces « échanges » de popularité et à une équation de point fixe :</p><blockquote><p class="citation"><em>pop</em> = Θ × <em>pop</em>,</p></blockquote><p class="paragraphesansretrait">une notation bien compacte pour un système de dix milliards d’équations à dix milliards d’inconnues. Il se trouve que ce système a pour solution le vecteur des popularités. Et là, banco ! Une technique connue nous permet de calculer cette solution.</p><h3 class="texte" id="anchor-toc-1-14">Le point fixe</h3><p class="texte"><span class="paranumber" id="para-72">72</span>Dans l’absence d’autre information, partons du vecteur <em>pop</em><sub>0</sub> défini par <em>pop</em><sub>0</sub><em>[i] = 1/N</em>, c’est-à-dire que toutes les pages sont supposées également populaires. Et définissons :</p><blockquote><p class="citation"><em>pop</em><sub>1</sub> = Θ × <em>pop</em><sub>0</sub> ; <em>pop</em><sub>2</sub> = Θ × <em>pop</em><sub>1</sub> ; <em>pop</em><sub>3</sub> = Θ × <em>pop</em><sub>2</sub>…</p></blockquote><p class="texte"><span class="paranumber" id="para-73">73</span>En poursuivant ce calcul, nous convergeons sur un point fixe qui se trouve être la solution de notre équation. Nous avons calculé le vecteur de popularité ! (Comme, en pratique, nous pouvons nous contenter de peu de précision, 6 ou 7 itérations suffisent.)</p><p class="texte"><span class="paranumber" id="para-74">74</span>Vous avez dit élémentaire ? Pas tant que ça. Même si la matrice est très « creuse<sup><a class="footnotecall" id="bodyftn26" href="#ftn26">26</a></sup> », pour réaliser ce calcul efficacement avec des volumes de données pareils, il faut des algorithmes très sophistiqués, une ingénierie de fou. Ce n’est peut-être plus des mathématiques mais c’est de l’informatique de toute beauté. </p><h2 class="texte" id="anchor-toc-1-15">Et pour conclure sur les moteurs de recherche</h2><p class="texte"><span class="paranumber" id="para-75">75</span>Nous avons présenté une version très simplifiée de ce qu’est un moteur de recherche. Les moteurs de recherche modernes combinent TF-IDF et la popularité des pages que nous venons de définir à bien d’autres critères pour choisir quelles pages classer en tête. Chaque jour, les moteurs de recherche sont plus sophistiqués<sup><a class="footnotecall" id="bodyftn27" href="#ftn27">27</a></sup> pour mieux répondre aux attentes des internautes. Ils se compliquent ne serait-ce que pour contrer les attaques comme celles des « spamdexeurs » qui trichent pour apparaître plus hauts dans les résultats. Ils nous posent aussi des problèmes essentiels. Pour n’en citer que quelques-uns :</p><ul class="texte"><li><p class="texte">L’interrogation de la Toile est basée sur des listes de mots-clés, une langue primitive quasiment sans grammaire. Il est sûrement possible de faire mieux.</p></li><li><p class="texte">Une mesure qui privilégie la popularité des pages a pour effet d’encourager l’uniformité, les pages populaires devenant de plus en plus populaires et les autres sombrant dans l’anonymat. C’est certainement discutable tout comme le fait que la popularité utilisée par les moteurs de recherche actuels semble ignorer si la page est citée pour sa qualité (son exactitude) ou pas.</p></li><li><p class="texte">Faut-il exclure des pages parce qu’elles sont racistes, vulgaires, fausses (pourquoi pas ?) ; pour favoriser un client ou ne pas déplaire à un gouvernement (au secours !) ?</p></li><li><p class="texte">Enfin, il est quelque chose d’extrêmement embarrassant dans la puissance considérable que les moteurs de recherche ont de par leur contrôle de l’information, surtout dans un contexte de quasi-monopole (au moins en Europe). Devons-nous leur faire confiance sans comprendre le secret de leur classement ? Et pourquoi ce secret ?</p></li></ul><p class="texte"><span class="paranumber" id="para-76">76</span>Je me trouvais dans le groupe de recherche sur les systèmes d’information à Stanford en 1995 quand deux jeunes étudiants, Sergeï Brin et Lawrence Page y travaillaient sur le prototype du moteur de recherche Google. J’ai été tout de suite conquis par leur proposition d’utiliser la popularité des pages. Il m’a fallu par contre m’habituer à l’idée de garder l’index en mémoire. Une telle technique aurait été irréaliste quelques années plus tôt, car elle aurait conduit à utiliser un nombre improbable de machines très coûteuses. En 1995, la gestion de l’index en mémoire devenait envisageable avec un nombre raisonnable de machines bon marché. Cela illustre bien qu’en informatique, les champs du possible évoluent en permanence. </p><p class="texte"><span class="paranumber" id="para-77">77</span>De retour en France, j’ai conçu avec deux étudiants, Mihai Preda et Grégory Cobena, un algorithme pour calculer la popularité des pages<sup><a class="footnotecall" id="bodyftn28" href="#ftn28">28</a></sup>. Concevoir cet algorithme, prouver qu’il calcule bien le point fixe de l’équation, l’implémenter sur une grappe de machines, fixer les bogues, l’optimiser, expérimenter, atteindre le milliard de pages. Je n’avais jamais touché à de tels volumes de données. C’est une de mes plus fantastiques expériences de chercheur. </p><p class="texte"><span class="paranumber" id="para-78">78</span>Plusieurs sociétés se partageaient dans les années 1990 le marché des moteurs de recherche. Les utilisateurs allaient plébisciter le moteur de Google. Comme base à ce succès extraordinaire, nous pourrions mentionner une ingénierie exceptionnelle pour faire fonctionner des milliers de machines 24 heures sur 24, des modèles commerciaux révolutionnaires, des techniques de <em>management</em> originales fondées sur le culte de la créativité. Mais en ce qui me concerne, je préfère me rappeler qu’au début, il y avait juste <em>un point fixe et quelques algorithmes</em>. </p><h1 class="texte" id="anchor-toc-1-16">4. Réseaux et connaissances collectives </h1><p class="epigraphe"><em>Avoir ou ne pas avoir de réseau : that’s the question.</em><br/>Bruno Latour</p><p class="texte"><span class="paranumber" id="para-79">79</span>L’écriture nous a permis d’« externaliser » en partie notre mémoire. L’imprimerie nous a permis de transmettre cette mémoire externe. La Toile a diminué considérablement les coûts de transmission de l’information. Surtout, elle a permis à chacun d’apporter sa contribution personnelle au patrimoine collectif (avec des réserves comme la fracture numérique, dont nous parlerons plus loin). La consommation passive d’informations du début de la Toile a ainsi cédé la place à des contributions actives par des internautes de plus en plus nombreux. Alice passe ses soirées sur Facebook à <em>chatter</em> avec une poignée d’amis quand son fils joue à World of Warcraft avec des copains du monde entier qu’il n’a jamais rencontrés « pour de vrai ». Elle publie son blog. Il twitte à longueur de journée. </p><p class="texte"><span class="paranumber" id="para-80">80</span>La Toile, c’est donc aussi une juxtaposition de milliards d’individus et de tous leurs réseaux. Après les réseaux de machines, les réseaux de contenus, nous atteignons les réseaux d’utilisateurs. Parmi les systèmes récents les plus répandus, nombreux sont ceux qui s’attachent à intensifier les échanges d’informations entre des individus à l’intérieur de leurs réseaux, depuis les jeux en ligne jusqu’aux logiciels de réseaux sociaux comme Facebook ou Google+. Les jeunes ont adopté avec passion les réseaux sociaux. Après un temps d’hésitation, les seniors, qui ont beaucoup de temps libre et peut-être la même envie de contacts sociaux, s’y engouffrent avec enthousiasme. </p><p class="texte"><span class="paranumber" id="para-81">81</span>Ces nouveaux systèmes n’ont plus pour cible l’universalité de la Toile, mais les individus et les groupes plus ou moins bien définis auxquels ils appartiennent. Ils redéfinissent les distances entre ces individus et proposent d’autres proximités. Prenons une personne qui nous est inconnue. Il nous suffit d’un nom, et si le nom est trop commun, de quelques vagues indications, pour que sa vie se déroule devant nous. Pour peu que cette personne soit un peu visible sur la Toile, elle envahit notre vie, avec ce qu’elle publie, ce qui se dit d’elle, par ses mille liens avec les autres et les traces qu’elle laisse un peu partout. Il n’est même pas nécessaire que la « cible » soit célèbre<sup><a class="footnotecall" id="bodyftn29" href="#ftn29">29</a></sup>. Nous nageons dans ce qui pourrait être un paradis pour un biographe d’antan, ou peut-être un cauchemar, car a disparu la place du rêve. </p><p class="texte"><span class="paranumber" id="para-82">82</span>Ces systèmes soulèvent un grand nombre de sujets de recherche, parfois à la frontière de l’informatique et de la sociologie. Nous allons insister ici sur un aspect particulièrement passionnant, l’émergence de connaissances collectives<sup><a class="footnotecall" id="bodyftn30" href="#ftn30">30</a></sup>. Plusieurs approches sont utilisées pour obtenir de telles connaissances : </p><ol style="list-style-type:decimal;" class="texte"><li><p class="texte">La notation, par exemple, de produits ou d’entreprises par des internautes ; </p></li><li><p class="texte">L’évaluation de l’expertise des internautes ; </p></li><li><p class="texte">La recommandation, par exemple, de produits ; </p></li><li><p class="texte">La collaboration entre internautes pour réaliser collectivement une tâche qui les dépasse individuellement ;</p></li><li><p class="texte">Le <em>crowdsourcing</em>, qui met des humains au service de systèmes informatiques.</p></li></ol><h2 class="texte" id="anchor-toc-1-17">La notation</h2><p class="texte"><span class="paranumber" id="para-83">83</span>L’internaute est invité à noter d’autres internautes, des services, des produits, et participe ainsi à la construction d’une connaissance collective. Par exemple, eBay permet aux acheteurs de donner leur avis sur les vendeurs de sa plateforme (et réciproquement). Cela conduit à une fantastique incitation à fournir un excellent service au risque, sinon, d’être mal noté et de perdre des clients. Les systèmes fourmillent, qui utilisent les avis de leurs utilisateurs, comme ViaMichelin pour les restaurants ou AlloCiné pour les films. Notons que, dans ces deux cas, les critiques qui notaient jusqu’alors les restaurants ou les films perdent une forme de monopole. Des systèmes plus expérimentaux essaient d’extraire des connaissances plus fines que des notes, à partir d’avis textuels. Nous rencontrons là les difficultés à analyser des sentiments d’un texte. </p><p class="texte"><span class="paranumber" id="para-84">84</span>Ces systèmes de notation ont aussi leur place au niveau global de la Toile. Par exemple, le système de marque-pages Delicious propose aux internautes d’associer des mots-clés (de la sémantique) aux pages. Une mesure de popularité, comme celle discutée dans la partie précédente, peut aussi être vue comme tenant de la notation : une référence à une page est interprétée comme une note positive, une critique participant autant qu’une louange à la popularité d’une page. À ce propos, il a été dit qu’une société de service délivrait <em>volontairement</em> de mauvais services à certains de ses clients pour que ceux-ci en parlent sur la Toile et augmentent ainsi la popularité, donc la visibilité, de la société en question. Même si cette information non vérifiée n’est peut-être qu’une des légendes de la Toile, le fait que la popularité ignore le sens des références est dérangeant. En analysant les liens de la Toile suivant un système de notation plus riche (avec des notes négatives), ce biais pourrait être corrigé.</p><h2 class="texte" id="anchor-toc-1-18">L’évaluation de l’expertise</h2><p class="texte"><span class="paranumber" id="para-85">85</span>Une technique essentielle pour évaluer la qualité d’une information est de déterminer la qualité de la source, la confiance que nous pouvons avoir dans les informations que cette source fournit en général. Pour illustrer ce type de techniques, nous mentionnerons un travail récent sur la corroboration<sup><a class="footnotecall" id="bodyftn31" href="#ftn31">31</a></sup>. Imaginons un système où des internautes introduisent des connaissances. Ils peuvent se tromper. Pourtant, s’ils ne faisaient que spécifier des connaissances positives comme « Alice possède une 2CV », rien ne pourrait empêcher le système de croire <em>tout </em>ce que disent les internautes<em>, </em>y compris toutes leurs erreurs. Pour que le système puisse commencer à douter, il faut que des internautes se contredisent, et pour cela, qu’ils se mettent à publier des informations négatives comme « Alice ne possède pas de BMW ». En général, les internautes ne veulent pas perdre de temps à entrer explicitement de telles informations, notamment parce que la liste des informations fausses est bien au-delà de l’accessible. Pourtant, les internautes publient des informations négatives <em>sans le savoir</em>. Par exemple, « Alice est née à Romorantin » indique qu’elle n’est pas née à Sèvres, du fait d’une « dépendance fonctionnelle », c’est-à-dire d’une loi que doivent satisfaire les données (ici, la loi qui spécifie qu’une personne ne peut pas être née à deux endroits distincts).</p><p class="texte"><span class="paranumber" id="para-86">86</span>Dans le travail cité précédemment, nous utilisons les informations incluant des négations provenant de dépendances fonctionnelles. Nous estimons la véracité des connaissances, en déduisons les taux d’erreurs de chaque internaute, ce qui nous procure une meilleure estimation de la véracité des connaissances, d’où des taux d’erreurs plus précis pour chaque internaute, etc. Nous continuons ce processus jusqu’à atteindre un point fixe (un de plus). Ce travail illustre bien comment il est possible de dégager collectivement des connaissances. </p><p class="texte"><span class="paranumber" id="para-87">87</span>Comme la notation, l’évaluation de l’expertise a sa place sur la Toile. C’est en particulier le cas pour ce qui concerne les informations publiées par la presse. Des blogs, comme celui de Maître Eolas pour les affaires juridiques, font maintenant autorité. De simples internautes sont de plus en plus amenés à remplacer les journalistes, comme récemment en Tunisie ou en Syrie. Cela ne rend que plus crucial le besoin de croiser les informations, de les vérifier. Nous pouvons imaginer que demain des programmes participeront à déterminer les réputations en termes d’information dans cet espace-temps étourdissant de la Toile. </p><h2 class="texte" id="anchor-toc-1-19">La recommandation</h2><p class="texte"><span class="paranumber" id="para-88">88</span>Un système comme Meetic utilise les données fournies par ses clients pour organiser des rencontres, pour les apparier. Un système comme Netflix recommande des films. Pour ce faire, ces systèmes réalisent typiquement des analyses statistiques dans le cadre classique très général de la fouille de données. Ils essaient de mettre en évidence des « proximités » entre clients dans Meetic, ou entre clients et produits dans Netflix. Ils peuvent regrouper des personnes parce qu’elles partagent les mêmes goûts, même si elles ne se sont jamais rencontrées, ou découvrir des affinités inattendues entre produits. L’exemple souvent cité est que les clients de couches-culottes achètent statistiquement beaucoup de bières. Les classifications des clients et des produits s’enrichissent donc mutuellement et participent ainsi à établir de nouvelles proximités entre individus et produits. </p><p class="texte"><span class="paranumber" id="para-89">89</span>De telles analyses sont réalisées à très grandes échelles par exemple par Amazon ou Google. Elles sont encore souvent mathématiquement peu fondées et leurs résultats sont rarement satisfaisants. Réaliser des analyses statistiques de qualité, sur des volumes de données de plus en plus grands, est un des défis du domaine de la gestion d’information. </p><h2 class="texte" id="anchor-toc-1-20">La collaboration</h2><p class="texte"><span class="paranumber" id="para-90">90</span>Wikipédia est un bel exemple d’édition coopérative. Un grand nombre d’internautes collaborent pour développer une encyclopédie. Tout le monde peut participer. Il est facile d’imaginer la cacophonie résultant des incompétences, des désaccords, des intérêts personnels. La tâche semble impossible. Pourtant, si la qualité de son contenu est parfois contestée, il est passionnant de voir la place considérable qu’a prise si rapidement Wikipédia dans la diffusion des connaissances<sup><a class="footnotecall" id="bodyftn32" href="#ftn32">32</a></sup>. Le recours à une foule d’auteurs a permis de dépasser la notion classique d’encyclopédie avec une couverture bien plus large. Nous trouvons de tout dans Wikipédia, depuis la biographie de Clémence Castel, une héroïne de Koh-Lanta, jusqu’à la preuve du Lemme de l’étoile, un résultat fondamental en théorie des langages. Les erreurs y sont nombreuses… Il y en a aussi dans les encyclopédies traditionnelles. </p><p class="texte"><span class="paranumber" id="para-91">91</span>Wikipédia est loin d’être le seul exemple de telles collaborations. Tout aussi étonnant est l’aboutissement des logiciels réalisés par des communautés de développeurs dans le cadre des logiciels libres, comme le système d’exploitation Linux. Et nous commençons à voir des communautés s’organiser pour construire des corpus de données ouvertes comme le Web des données (en anglais, <em>linked data</em>) du W3C (World Wide Web Consortium).</p><h2 class="texte" id="anchor-toc-1-21">Le <em>crowdsourcing</em></h2><p class="texte"><span class="paranumber" id="para-92">92</span>Nous utiliserons ici le terme anglais <em>crowdsourcing</em><sup><a class="footnotecall" id="bodyftn33" href="#ftn33">33</a></sup>. Il s’agit de publier sur la Toile des problèmes que des programmes ne savent pas bien résoudre ; des internautes proposent alors des réponses, moyennant finance. Des systèmes comme le Mechanical Turk<sup><a class="footnotecall" id="bodyftn34" href="#ftn34">34</a></sup> d’Amazon permettent de tels contacts. Les compétences de la foule ont été utilisées par exemple pour rechercher – sans succès – l’un des plus célèbres chercheurs du domaine des bases de données, Jim Gray, disparu avec son yacht au large des îles Farallon. Les internautes devaient observer des photos-satellite à la recherche d’indices. En utilisant un jeu vidéo, Foldit, des internautes sont en revanche arrivés à décoder la structure d’une enzyme proche de celle du virus du sida<sup><a class="footnotecall" id="bodyftn35" href="#ftn35">35</a></sup>. Ils ont réalisé ce qui bloquait experts et ordinateurs : comprendre comment cette enzyme se repliait dans un espace en trois dimensions pour construire sa structure. Le jeu se marie ici au réseau, dans le plus pur esprit des réseaux sociaux. </p><p class="texte"><span class="paranumber" id="para-93">93</span>L’originalité de tels dispositifs est que l’individu se retrouve au service d’un système informatique, qui l’utilise, par exemple, pour compléter sa base de connaissances ou résoudre des contradictions dans cette base.</p><h2 class="texte" id="anchor-toc-1-22">Le pouvoir des masses d’internautes</h2><p class="epigraphe">群众是真正的英雄<sup><a class="footnotecall" id="bodyftn36" href="#ftn36">36</a></sup>.<br/>Mao Tsé-Toung</p><p class="texte"><span class="paranumber" id="para-94">94</span>Ces approches conduisent en général à résoudre des problèmes complexes d’analyse de données impliquant un grand nombre de personnes et de gros volumes d’information. L’évaluation de la « qualité » est au cœur du sujet : la qualité d’une information, la qualité d’une source (un internaute, un service). Et, de plus en plus, l’individu est au centre du dispositif, passivement par exemple <em>via</em> son profil, ou activement par exemple, en spécifiant ce qu’il sait, ce qu’il croit, ce qu’il aime.</p><p class="texte"><span class="paranumber" id="para-95">95</span>Confronté à des systèmes s’attachant à construire une connaissance collective, l’internaute ignore le plus souvent quelles données ont été utilisées et ne comprend parfois pas comment le résultat a été obtenu. Il peut être alors amené à trouver les informations proposées, surprenantes, magiques, inquiétantes. La difficulté d’expliquer les résultats est une faiblesse souvent présente dans les approches que nous venons de discuter et qui en limite les usages.</p><p class="texte"><span class="paranumber" id="para-96">96</span>Un autre problème sérieux de ces approches est lié aux atteintes à la confidentialité de l’information. Pour mieux servir leurs utilisateurs, ces systèmes doivent réunir le plus d’informations possibles sur eux. Un réseau social comme Facebook construit par exemple une base de connaissances sur chacun de ses clients. L’internaute est de plus en plus souvent amené à fournir des informations pour bénéficier de la gratuité de services. Les systèmes vont même jusqu’à s’échanger des informations sur leurs clients ; toujours pour mieux les servir ? Cela conduit à des conflits d’intérêts. Un système de réseau social doit choisir entre le besoin de protéger les données de ses clients (au risque, sinon, de les perdre) et son avidité naturelle pour les données confidentielles. De son côté, l’internaute aimerait bien que les informations le concernant restent le plus confidentielles possible mais il est aussi friand de services très personnalisés. </p><p class="texte"><span class="paranumber" id="para-97">97</span>Pour conclure cette partie, oublions temporairement ces problèmes pour nous émerveiller de voir des algorithmes faire surgir des informations disponibles sur la Toile des connaissances dont nous n’imaginions pas l’existence. Ceci nous conduit à un domaine plus ancien mais qui, avec la Toile, se découvre une nouvelle jeunesse : la <em>gestion de connaissances</em>. C’est le sujet de notre prochaine partie. </p><h1 class="texte" id="anchor-toc-1-23">5. La Toile des connaissances</h1><p class="epigraphe"><sup><a class="footnotecall" id="bodyftn37" href="#ftn37">37</a></sup>תָּמוּת מֹות מִמֶּנּוּ אֲכָלְךָ בְּיֹום כִּי מִמֶּנּוּ תֹאכַל לֹא וָרָע טֹוב הַדַּעַת וּמֵעֵץ</p><p class="texte"><span class="paranumber" id="para-98">98</span>Le domaine des bases de connaissances existait depuis longtemps quand est née la Toile. Mais si les bases de données étaient déjà alors une industrie florissante, les bases de connaissances peinaient à se faire une place au soleil. Cette place, elles sont en train de l’acquérir avec la Toile. </p><p class="texte"><span class="paranumber" id="para-99">99</span>La Toile des documents est fondée sur le fait que les gens aiment écrire, lire, dire, écouter du texte dans leur langue naturelle. Aujourd’hui, les internautes communiquent principalement entre eux à l’aide de texte. Pourquoi et comment passer à une Toile des connaissances ? Et tout d’abord, qu’est-ce que c’est ?</p><h2 class="texte" id="anchor-toc-1-24">Le Web sémantique</h2><p class="texte"><span class="paranumber" id="para-100">100</span>Dans sa forme la plus homéopathique, il s’agit d’expliquer le sens de documents textuels de la Toile, d’éléments qui les composent, ou, comme nous le verrons plus loin, de services informatiques disponibles sur la Toile (les services Web). Cela peut se faire en publiant des <em>métadonnées</em>, c’est-à-dire des données qui expliquent les données. Par exemple, pour le document que vous êtes en train de lire, nous pourrions publier : </p><blockquote><p class="citation">auteur = Serge Abiteboul<br/>nature = leçon inaugurale<br/>institution = Collège de France<br/>date = mars 2012<br/>langue = français</p></blockquote><p class="texte"><span class="paranumber" id="para-101">101</span>À l’intérieur des documents, des étiquettes sémantiques peuvent aussi être attachées à des fragments constitutifs d’un texte pour les expliquer. Par exemple, accolée à la chaîne de caractères <em>Woody Allen</em>, l’étiquette <em>dbpedia:Woody_Allen</em> précise qu’il s’agit d’une personne référencée dans dbpedia, une base de connaissances très utilisée. Nous trouverons notamment dans cette ontologie qu’il s’agit du célèbre cinéaste qui a réalisé <em>Manhattan</em>. </p><p class="texte"><span class="paranumber" id="para-102">102</span>Les bases de connaissances comme dbpedia sont appelées des<em> ontologies</em>. En simplifiant, une ontologie se compose de phrases comme celles-ci :</p><ol style="list-style-type:decimal;" class="texte"><li><p class="texte"><em><strong>classes</strong></em><em> Personne, Réalisateur, Cinéaste</em></p></li><li><p class="texte"><em>Réalisateur </em><em><strong>sous classe de</strong></em><em> Personne</em></p></li><li><p class="texte"><em>Réalisateur </em><em><strong>synonyme de</strong></em><em> Cinéaste</em></p></li><li><p class="texte"><em>dbpedia:Woody_Allen </em><em><strong>est un</strong></em><em> Réalisateur </em></p></li><li><p class="texte"><em><strong>relation</strong></em><em> a_réalisé</em></p></li><li><p class="texte"><em>dbpedia:Woody_Allen a_réalisé film:Manhattan</em></p></li></ol><p class="paragraphesansretrait">qui spécifient des classes d’objets (1), des inclusions ou des égalités entre classes (2, 3), l’appartenance d’un objet à une classe (4), des relations entre objets (5), des instances de ces relations (6). </p><p class="texte"><span class="paranumber" id="para-103">103</span>Utiliser un texte brut découvert sur la Toile sans explication s’apparente à utiliser les résultats d’une expérience scientifique en ignorant les conditions de sa réalisation, ses unités de mesure, etc. Des étiquettes introduites dans le texte, basées sur des ontologies, précisent le sens de ce texte, l’enrichissent en y ajoutant de la sémantique. Par exemple, l’étiquette <em>dbpedia:Woody_Allen</em>, attachée à une phrase, indique que la phrase parle de Woody Allen, un réalisateur, un cinéaste, une personne, et pas du musicien Allen Woody. Et cette phrase devient une réponse à la question sous forme de mots-clés « <em>cinéaste Woody Allen Manhattan </em>» même si elle ne contient ni le mot <em>cinéaste</em> ni le mot <em>Manhattan</em>. Par contre, une phrase parlant d’un séjour de Allen Woody (précisant qu’il s’agit du musicien <em>dbpedia:Allen_Woody</em>) à Manhattan ne serait pas comprise comme une réponse. L’ontologie permet donc de répondre de façon plus fine aux requêtes. </p><p class="texte"><span class="paranumber" id="para-104">104</span>Sur la Toile, n’importe qui peut publier ses propres ontologies. Des experts utilisent des terminologies spécifiques suivant leur langue, leur domaine, leur culture, etc. dans la pure tradition de tour de Babel. Cette diversité est une richesse mais elle complique la recherche de connaissances. La même information peut être représentée de multiples manières. Surtout, nous sommes sur la Toile et nous allons trouver des masses de faits erronés. Ce qui est encore plus compliqué à gérer, c’est que des sites peuvent publier des règles qui mettent en péril nos propres connaissances. Par exemple, qu’allons-nous faire si quelqu’un affirme que « <em>Personne</em> est un synonyme de <em>Film</em> » ? Si nous ne pouvons l’interdire, nous devons faire en sorte que cela ne pollue pas nos raisonnements. </p><p class="texte"><span class="paranumber" id="para-105">105</span>Cela conduit à toute une gamme de problèmes passionnants : comment utiliser des ontologies pour mieux répondre aux questions des internautes ? Comment « aligner » des ontologies, c’est-à-dire établir des liens entre leurs concepts et leurs relations, pour « intégrer » des informations venues de sources indépendantes ? Comment gérer les incohérences ? Comment évaluer la qualité des connaissances ? </p><h2 class="texte" id="anchor-toc-1-25">De l’acquisition de connaissances </h2><p class="texte"><span class="paranumber" id="para-106">106</span>Maintenant que nous comprenons l’intérêt de disposer de connaissances en plus de textes, la question difficile devient « comment acquérir ces connaissances ? ». Un expert chimiste va par exemple « entrer » dans une base (en utilisant un éditeur) ses connaissances sur les molécules qu’il étudie. Il a une raison objective de le faire : l’avancement de la science. Et ce genre de publication dans des bases de données contribue aujourd’hui à une visibilité scientifique au même titre que des publications dans des journaux scientifiques. Mais les mêmes individus qui aiment publier sur la Toile dans leur langue naturelle apprécient peu les contraintes d’un éditeur de connaissances. Les cas d’internautes entrant volontairement et gratuitement des connaissances dans un système restent rares et, le plus souvent, les tâches de construction de bases de connaissances sont laissées à des logiciels. </p><p class="texte"><span class="paranumber" id="para-107">107</span>Prenons par exemple la base de connaissances Yago, développée à partir de la version anglaise de l’encyclopédie Wikipédia que nous avons déjà mentionnée. Wikipédia est au départ une collection de textes. Pour améliorer sa précision, ses éditeurs encouragent l’introduction de fragments de connaissances. (Allez sur la page Wikipédia de Woody Allen et cliquez sur l’onglet « Modifier » pour vous en convaincre.) C’était donc un excellent point de départ pour développer une « vraie » base de connaissances. Cette base, appelée Yago, a été construite à l’aide d’un logiciel développé à l’Institut Max Planck<sup><a class="footnotecall" id="bodyftn38" href="#ftn38">38</a></sup>. En 2011, Yago avait déjà 2 millions d’entités et 20 millions de relations entre ces entités. </p><p class="texte"><span class="paranumber" id="para-108">108</span>Si la Toile reste très largement dominée par le HTML et le texte, les bases de connaissances de demain sont déjà en construction à partir de l’énorme ressource que constitue la masse de documents textuels. Il s’agit essentiellement de comprendre les textes et d’en « extraire » des connaissances. La tâche est complexe parce qu’elle met en jeu la compréhension de la langue. Les extracteurs de connaissances font des erreurs et il est difficile de leur en vouloir : ils partent de textes qui fourmillent d’imprécisions, d’erreurs et de faits comme « Jérusalem est la capitale d’Israël » qui peuvent être controversés. L’intégration des connaissances de plusieurs sources est aussi délicate, comme l’est la vérification des connaissances obtenues. Tout cela met en jeu une gamme de techniques complexes, notamment les techniques de corroboration ou de <em>crowdsourcing</em> dont nous avons déjà parlé. </p><p class="texte"><span class="paranumber" id="para-109">109</span>Et demain ? À côté des documents textuels, il faut s’attendre à voir proliférer des millions de bases de données ou de connaissances, de toutes tailles, de toutes natures, de qualités variables, et des liens entre elles. Le problème aura peut-être changé mais resteront les questions fondamentales : où trouver une information spécifique et quel site est fiable ?</p><h2 class="texte" id="anchor-toc-1-26">Les services Web </h2><p class="texte"><span class="paranumber" id="para-110">110</span>La publication de connaissances permet de mieux répondre aux requêtes. Elle rend surtout possible l’utilisation de la Toile par des machines. Prenons la requête très simple suivante : « qui a réalisé le film <em>Manhattan</em> ? ». Un utilisateur humain n’aura aucun mal à trouver la bonne réponse sur la Toile, par exemple en utilisant IMDb. Ce sera plus compliqué pour une machine. Par contre, un logiciel pourra dialoguer avec d’autres logiciels et comprendre des réponses comme : </p><blockquote><p class="citation"><em>( dbpedia:Woody_Allen, a_réalisé, film:Manhattan ).</em></p></blockquote><p class="texte"><span class="paranumber" id="para-111">111</span>Nous appellerons <em>services Web</em> des logiciels connectés à Internet dialoguant avec d’autres logiciels, s’échangeant des données structurées suivant les protocoles de la Toile. </p><p class="texte"><span class="paranumber" id="para-112">112</span>À la base de tout cela, nous trouvons des standards. Une anecdote nous permettra de souligner leur intérêt. Nous voulions utiliser un programme de classification de documents développé par des collègues. Pour pouvoir faire fonctionner ce logiciel, il fallait d’abord installer plusieurs librairies de programmes, certaines incompatibles avec notre environnement de développement. Le cauchemar habituel de l’installation de logiciel. Heureusement, quelqu’un a eu l’idée (pas si évidente au début des années 1990) d’utiliser le programme de classification comme service Web. Les collègues ont installé leur logiciel sur une machine connectée au réseau et quelques instants plus tard, nous pouvions utiliser le service. Sans les standards de la Toile, il nous aurait sans doute fallu des jours de travail frustrant et improductif. </p><p class="texte"><span class="paranumber" id="para-113">113</span>Mais revenons à notre cinéphile. Il utilise un service, disons TMLF, pour « TrouveMoiLeFilm ». Notre cinéphile précise (en s’appuyant sur des ontologies) ce qu’il veut : voir le film <em>Manhattan</em>. TMLF cherche pour lui des offres de ce film en vidéo à la demande en utilisant les descriptions de services de la Toile (aussi basées sur des ontologies). TMLF compare les prix, les prestations de chaque service, en tenant compte des abonnements de la personne, de ses préférences, notamment linguistiques, etc. Dans cette tâche, TMLF collabore avec d’autres services et échange avec eux des données, des connaissances. Et au final, TMLF peut démarrer le film sur la télévision familiale. La Toile, qui était l’apanage de l’être humain, s’est ainsi mise au service de services de la Toile, et les services de la Toile au service de tous.</p><h2 class="texte" id="anchor-toc-1-27">L’inférence</h2><p class="texte"><span class="paranumber" id="para-114">114</span>Comprendre le sens des données, répondre plus précisément aux requêtes, voilà des avantages apportés par les bases de connaissances. Mais le plus fascinant d’un point de vue technique est la possibilité de s’appuyer sur la logique pour inférer automatiquement de nouvelles connaissances. Pour expliquer cela, nous allons réexaminer la notion de <em>fait</em>. Nous avons rencontré jusqu’à présent des <em>faits extensionnels</em>, comme <em>Séance</em>(<em>Star Wars</em>, <em>Sel</em>, <em>22:15</em>), qui correspondent à des n-uplets stockés dans la base de données. La base de données est donc dépositaire de tous les faits extensionnels du monde. Introduisons maintenant des connaissances sous forme de lois (de règles) comme : </p><blockquote><p class="citation">SouhaiteVoir( Alice, <em>t</em> ) ← Film( <em>t</em>, Hitchcock, <em>a</em> ), <em>not</em> Vu( Alice, <em>t</em> )</p></blockquote><p class="paragraphesansretrait">que l’on peut lire « si <em>t</em> est le titre d’un film d’Hitchcock, <em>a </em>un acteur de ce film, et si Alice n’a pas vu ce film<em>, </em>alors elle souhaiterait le voir <em>»</em>. À partir de telles règles et de faits comme « <em>Psychose</em> est un film d’Hitchcock » et Alice ne l’a pas vu, nous allons pouvoir inférer un fait comme « Alice souhaiterait voir le film <em>Psychose </em>», un fait qui n’est stocké dans aucune base de données. Nous parlerons de <em>faits intentionnels. </em>C’est ce genre de règles toutes simples qui permet à des logiciels de raisonner.</p><p class="texte"><span class="paranumber" id="para-115">115</span>Observez que répondre à une requête est devenu plus compliqué. Il faut maintenant inférer des faits qui permettent d’inférer d’autres faits, ainsi de suite. Évidemment, il faut éviter d’inférer <em>tous</em> les faits possibles, car cela demanderait trop de temps et trop d’espace-mémoire ou de stockage. Parmi les plus beaux algorithmes du domaine, nous trouvons d’ailleurs des algorithmes inspirés de la programmation logique, qui permettent d’éviter d’inférer des faits inutilement<sup><a class="footnotecall" id="bodyftn39" href="#ftn39">39</a></sup>. Nous n’aurons pas le temps de les décrire dans cette leçon. </p><h2 class="texte" id="anchor-toc-1-28">Penser global</h2><p class="texte"><span class="paranumber" id="para-116">116</span>L’inférence est essentielle dans le cadre d’une Toile des connaissances en devenir, notamment pour mieux répondre aux requêtes ou pour intégrer de l’information provenant de sources hétérogènes. Nous pouvons imaginer demain des millions, des milliards de systèmes qui échangent des connaissances, infèrent des connaissances. Il faut pourtant raison garder. Il ne s’agit pas ici de raisonnements très compliqués, comme par exemple ceux d’une démonstration mathématique, mais juste d’échanges d’informations. Se posent pourtant d’énormes défis techniques : comment raisonner avec de pareils volumes de connaissances ? Comment ne pas être simplement submergés par les faits inférés ? Comment garantir la qualité des informations ? Leur confidentialité ? Comment expliquer les faits obtenus ? </p><p class="texte"><span class="paranumber" id="para-117">117</span>Et puis notre environnement va changer. Il va nous falloir apprendre à vivre dans un monde où nous serons entourés de systèmes qui raisonnent, s’échangent des connaissances, interagissent avec nous. Comment cela va-t-il modifier notre manière même de savoir, de penser ? </p><h1 class="texte" id="anchor-toc-1-29">Conclusion</h1><p class="epigraphe"><em><span lang="en">Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information</span></em><sup><a class="footnotecall" id="bodyftn40" href="#ftn40">40</a></sup><span lang="en">?<br/></span>T.S. Eliot</p><p class="texte"><span class="paranumber" id="para-118">118</span>Le passage de biens concrets à des informations numériques relativement immatérielles permet de souligner une particularité fondamentale de l’informatique : <em>l’informatique est une science de l’immatériel. </em>En cela, elle diffère des sciences du matériel comme la physique, la chimie, les sciences de la vie et de la Terre, par les techniques et souvent les mathématiques qu’elle utilise. Cela induit, pour l’industrie informatique, ses propres particularités tant pour la fabrication, la distribution ou la maintenance des produits que pour les modèles commerciaux. C’est cette immatérialité que nous avons rencontrée presqu’à chaque page de cette leçon. </p><p class="texte"><span class="paranumber" id="para-119">119</span>La Toile est multiforme. Elle vit sur un Internet que nous souhaiterions le plus neutre<sup><a class="footnotecall" id="bodyftn41" href="#ftn41">41</a></sup> possible. Elle est omniprésente. Il est devenu quasi impossible de vivre sans : de trouver du travail, de travailler, de se loger, de gérer ses comptes bancaires, de faire partie d’une association, presque d’avoir des amis, etc. Nous sommes nombreux à partager la nostalgie du monde romantique, idéaliste, anarchiste, anarchique, de la Toile ouverte des débuts. La Toile évolue inexorablement vers des espaces plus fermés<sup><a class="footnotecall" id="bodyftn42" href="#ftn42">42</a></sup> notamment sous la pression de la monétarisation des contenus. Elle reste à la fois la plus belle des dentelles, le tissu de toutes les connaissances humaines et le terreau des plus horribles fantasmes, de toutes les violences. Elle est aussi l’univers d’une croissance arrogante dans ses imprécisions et ses incohérences qui noient les perles d’humanité, et d’une alchimie improbable qui transforme la masse en qualité. </p><p class="texte"><span class="paranumber" id="para-120">120</span>Ce que nous avons appris de la Toile ces dernières années, c’est qu’au-delà d’une collection universelle de documents, elle offrait une gamme infinie d’applications à inventer. Nous avons vu arriver le Web des téléphones « intelligents », que nous sommes nombreux à avoir adoptés avec enthousiasme tout en nous inquiétant de leurs aspects anxiogènes. Même s’il partage des protocoles informatiques avec la Toile classique, ce monde est souvent en contradiction avec la philosophie d’une Toile « libre, gratuite et universelle », les applications payantes devenant la norme. Nous avons parlé du Web des réseaux sociaux et du Web sémantique. Si nous avions eu plus de temps, nous aurions considéré le Web des objets et de l’intelligence ambiante qui a transformé le commerce avec les RFID (Radio Frequency IDentification) et dont on nous promet qu’il va « révolutionner » notre habitat. Et nous assistons au fantastique succès du Web des mondes virtuels, notamment avec les jeux vidéo. </p><p class="texte"><span class="paranumber" id="para-121">121</span>Si nous avons essayé d’éviter une présentation béatement optimiste des technologies de gestion de données, nous avons beaucoup insisté dans ce texte sur les succès technologiques, notamment dans le contexte de la Toile. Nous évoquerons brièvement certains écueils, en essayant de mettre en évidence les sujets de recherche qu’ils suggèrent. </p><h2 class="texte" id="anchor-toc-1-30">Éviter la noyade dans un océan de données</h2><p class="texte"><span class="paranumber" id="para-122">122</span>Cela a été un des fils conducteurs de cette leçon. Un des grands défis des années à venir est de développer les technologies qui permettront de trouver, évaluer, valider, vérifier, hiérarchiser l’information pour aider l’internaute à obtenir « la bonne information, au bon moment ». Cela implique de poursuivre les recherches dans des domaines comme l’évaluation de la réputation, la recommandation, ou la personnalisation.</p><h2 class="texte" id="anchor-toc-1-31">Accès à l’information pour tous</h2><p class="texte"><span class="paranumber" id="para-123">123</span>Des « fractures numériques » existent. La fracture générationnelle, grossièrement, entre ceux qui sont nés avant et après Internet, tend à disparaître avec des objets comme l’iPad. La fracture entre urbains et ruraux pourrait disparaître facilement avec un peu de volonté politique, les ruraux adoptant ces nouvelles technologies avec au moins autant d’appétit que les citadins. Les fractures sociales<sup><a class="footnotecall" id="bodyftn43" href="#ftn43">43</a></sup> et Nord-Sud sont autrement plus préoccupantes. L’informatique peut aider à les réduire avec des logiciels toujours plus simples à utiliser, des logiciels surtout libres. Mais il s’agit d’abord d’un problème d’éducation. En France, nous assistons à des progrès en matière d’enseignement de l’informatique. Le chemin encore à parcourir reste considérable. Il faut aussi que la bibliothèque gratuite du coin de la rue cède la place à la bibliothèque numérique, gratuite et universelle, de la Toile. L’utopie est devenue réalisable : l’accès, pour tous, à toute la culture et à toutes les connaissances. </p><h2 class="texte" id="anchor-toc-1-32">Démocratie ou pas</h2><p class="texte"><span class="paranumber" id="para-124">124</span>La Toile et les systèmes informatiques peuvent se mettre au service des gouvernants pour « fliquer » les citoyens, voire les opprimer. Ils peuvent aussi permettre d’établir une démocratie des contre-pouvoirs avec des réseaux de militants qui contrôlent, surveillent, dénoncent, et notent les pouvoirs publics et, par là-même, contribuent à améliorer le fonctionnement de la démocratie. Les choix sont principalement politiques mais les scientifiques ont un rôle à jouer dans l’établissement de ces contre-pouvoirs. Il s’agit en particulier de développer les technologies permettant de contrôler les puissants : les États, les multinationales.</p><h2 class="texte" id="anchor-toc-1-33">Et la vie privée ?</h2><p class="texte"><span class="paranumber" id="para-125">125</span>Nous prenons de plus en plus conscience des risques que nous courrons à disperser sur la Toile des informations que nous voudrions garder confidentielles. L’un des risques les plus aigus est peut-être l’usurpation d’identité. C’est le rôle de la science de développer les outils qui nous permettent, en s’appuyant sur des lois qui protègent les données personnelles, de regagner le contrôle sur notre information. Il s’agit bien sûr pour les gouvernements de légiférer, mais il est important que nous nous accordions aussi sur une éthique de la protection de la vie privée.</p><h2 class="texte" id="anchor-toc-1-34">Pour des individus meilleurs ou pires ? </h2><p class="texte"><span class="paranumber" id="para-126">126</span>Est-ce que les outils informatiques nous rendent plus heureux ? Plus intelligents ? Plus productifs ? Le rapprochement des distances avec certains peut-il devenir la cause de l’éloignement des autres, au risque d’enfermer l’individu dans des communautés aliénantes ? Au contact de toute cette virtualité, y a-t-il un risque de perdre tout contact avec la « vraie » vie ? Est-ce qu’une rencontre est moins vraie sur la Toile qu’au bistrot du coin ? Et, peut-être, la mère de toutes les questions : allons-nous utiliser ces outils pour ne plus penser<sup><a class="footnotecall" id="bodyftn44" href="#ftn44">44</a></sup> ou, au contraire, pour mieux penser et être plus créatifs ?</p><p class="texte"><span class="paranumber" id="para-127">127</span>Les réponses à ces questions dépendent beaucoup des nouveaux outils informatiques qui restent à inventer avec, peut-être plus encore qu’avant, la préoccupation de mieux servir les utilisateurs, et pourquoi pas, de les rendre meilleurs. D’un point de vue technique, un des défis est de pouvoir offrir à l’individu tous les avantages des systèmes de la Toile les plus avancés, notamment les réseaux sociaux ou les systèmes de recommandation, sans qu’il ait besoin d’aliéner le contrôle des informations qui le concernent, comme c’est trop le cas aujourd’hui. Un autre défi est d’améliorer la production collective de connaissances. Il faut aussi nous permettre de mieux utiliser toutes ces connaissances dans nos prises de décisions, en les intégrant mieux dans les outils logiciels que nous utilisons au quotidien comme le téléphone, le courrier ou l’agenda électronique.</p><p class="epigraphe"><em><span lang="en">Prediction is very difficult, especially about the future</span></em><sup><a class="footnotecall" id="bodyftn45" href="#ftn45">45</a></sup><span lang="en">.<br/></span>Niels Bohr</p><h2 class="texte" id="anchor-toc-1-35">Et demain ?</h2><p class="texte"><span class="paranumber" id="para-128">128</span>Sous la pression de jeunes pousses très dynamiques et de jeunes géants comme Facebook ou Google, les technologies de la Toile se sont développées très rapidement. Comme souvent en informatique, des solutions ont été bricolées « vite fait mal fait » (<em>quick and dirty</em>). Si le domaine de la gestion de données montre aujourd’hui un dynamisme étincelant, il tient pourtant encore de la forêt vierge quand nous atteignons la Toile : il n’est pas aisé d’en dresser l’état de l’art ; il n’est pas simple de l’enseigner ; il n’est pas évident de prévoir quelles tendances seront amenées à durer. Les bases logiques, qui faisaient la beauté du modèle relationnel, se présentent encore dans le désordre pour ce qui est de la Toile. Une solution globale est à inventer. Les liens avec la logique, la théorie de la complexité, la théorie des langages et des automates, sont à revisiter. De nouvelles théories sont sans doute à établir. Les systèmes que nous utilisons sont à améliorer ; de nouvelles fonctionnalités sont à inventer. Un vaste programme ! </p><p class="texte"><span class="paranumber" id="para-129">129</span>Il n’est pas possible, ni souhaitable, de renoncer à la Toile comme il n’a pas été possible de refuser l’écriture ou l’imprimerie. Et malgré tous les écueils de la Toile, je veux continuer à croire qu’elle participera à féconder un meilleur futur. Quant aux aspects plus techniques, je me hasarderai à prédire que la prochaine étape des sciences des données, que l’on retiendra, a déjà commencé : c’est la Toile des connaissances. Elle a déjà été annoncée plusieurs fois. Elle arrive lentement, mais elle arrive vraiment. </p><p class="texte"><span class="paranumber" id="para-130">130</span>Des données à l’information, et de l’information aux connaissances, le cheminement est naturel. </p> </div> </div> <h2 class="title--alt bottom">Remerciements</h2> <div class="mb-3"><p class="remerciements"><em>Remerciements :</em> Nous tenons à remercier le Collège de France, l’INRIA ainsi que le Conseil de recherche européen, <em>via</em> le projet Webdam sur « Foundations of Web data Management ». Nous tenons aussi à remercier Martín Abadi, Jérémie Abiteboul, Manon Abiteboul, Gilles Dowek, Emmanuelle Fleury, Laurent Fribourg, Sophie Gamerman, Bernadette Goldstein, Florence Hachez-Leroy, Tova Milo, Marie-Christine Rousset, Luc Segoufin, Pierre Senellart et Victor Vianu pour leurs commentaires sur ce texte. </p></div> <div id="anchor-footnotes" class="mb-3 scrollspy-target anchor--toc--section"> <h1 class="title--alt bottom">Notes de bas de page</h1> <div class="foot_notes"><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn1" id="ftn1">1</a> Gérard Berry, <em>Pourquoi et comment le monde devient numérique</em>, Collège de France / Fayard, coll. « Leçons inaugurales », n<sup>o</sup> 197, 2008.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn2" id="ftn2">2</a> Gérard Berry, <em>Penser, modéliser et maîtriser le calcul informatique</em>, Collège de France / Fayard, coll. « Leçons inaugurales », n<sup>o</sup> 208, 2010. <br/>Martin Abadi, <em>La Sécurité informatique</em>, Collège de France / Fayard, n<sup>o</sup> 219, 2011, <a href="http://dx.crossref.org/10.4000/lecons-cdf.443"><span style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.4000/lecons-cdf.443"> : 10.4000/lecons-cdf.443</a>.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn3" id="ftn3">3</a> Nous entendons par langues « naturelles » des langues élaborées dans le temps par des groupes de locuteurs, comme le français ou l’anglais. Ceci est moins en opposition avec des langues « construites » comme l’espéranto, qu’avec des langages formels comme la logique du premier ordre, SQL ou Java.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn4" id="ftn4">4</a> « Écoute Dave. Je vois bien que tu es très affecté par tout cela. Et je pense vraiment que tu devrais reprendre tes esprits, prendre un calmant et essayer de faire le point. »</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn5" id="ftn5">5</a> Définir précisément ces notions n’est pas chose facile. Voir par exemple : Luciano Floridi, <em><span lang="en">The Philosophy of Information</span></em><span lang="en">, Oxford University Press, 2011.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn6" id="ftn6">6</a> Ses données persistent après que l’ordinateur a été éteint.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn7" id="ftn7">7</a> Les évolutions suivantes ont été observées approximativement jusqu’à présent. Concernant les capacités de stockage, la densité de mémoire des disques durs double chaque année (loi de Kryder). Quant aux circuits, la densité de transistors sur une puce de silicium double tous les deux ans (loi de Moore). </p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn8" id="ftn8">8</a> <a href="http://michaelbrodie.com/">http://michaelbrodie.com</a>.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn9" id="ftn9">9</a> « La logique est le commencement de la sagesse, pas sa fin. »</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn10" id="ftn10">10</a> <span lang="en">Serge Abiteboul, Richard Hull et Victor Vianu, </span><em><span lang="en">Foundations of Databases</span></em><span lang="en">, Addison-Wesley, 1995 : </span><a href="http://webdam.inria.fr/Alice"><span lang="en">http://webdam.inria.fr/Alice</span></a><span lang="en">. <br/></span>Michael Benedikt et Pierre Senellart, « Databases », in E. K. Blum et A. V. Aho (dir.), <em>Computer Science. </em><em><span lang="en">The Hardware, Software and Heart of It</span></em><span lang="en">, Springer-Verlag, 2012, p. 169-229, </span><a href="http://dx.crossref.org/10.1007/978-1-4614-1168-0_10"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1007/978-1-4614-1168-0_10"><span lang="en"> : 10.1007/978-1-4614-1168-0_10</span></a><span lang="en">.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn11" id="ftn11">11</a> SQL va plus loin que le calcul relationnel. Par exemple, il permet d’ordonner les résultats et d’appliquer des fonctions simples comme la somme ou la moyenne.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn12" id="ftn12">12</a> Pour ces complexités « faibles », le modèle de calcul précis est important. Nous parlons ici de calcul sur des machines RAM. </p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn13" id="ftn13">13</a> Un exemple de problème difficile dans <em>NP</em> est celui du <em>voyageur de commerce </em>: étant donné des villes, des routes entre ces villes, et les longueurs de ces routes, comment trouver le plus court chemin pour relier toutes les villes.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn14" id="ftn14">14</a> Comme il y a un nombre fini d’états possibles, il est possible de détecter si le programme est entré dans une boucle, mais au prix d’un travail supplémentaire. </p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn15" id="ftn15">15</a> <span lang="en">Serge Abiteboul et Victor Vianu, « Generic computation and its complexity », </span><em><span lang="en">Proceedings of the 23</span></em><sup><em><span lang="en">rd</span></em></sup><em><span lang="en"> annual ACM symposium on theory of computing</span></em><span lang="en">, New York, ACM, 1991, p. 209-219, </span><a href="http://dx.crossref.org/10.1145/103418.103444"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1145/103418.103444"><span lang="en"> : 10.1145/103418.103444</span></a><span lang="en">.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn16" id="ftn16">16</a> Dans notre discussion, nous supposons que le domaine n’est pas ordonné. Le problème est différent si nous considérons que le domaine est ordonné. Vardi a montré que <em>fixpoint</em> permet de calculer exactement toutes les requêtes dans <em>P</em>, et que <em>while</em> exprime exactement<em> </em>les requêtes dans<em> pspace</em>.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn17" id="ftn17">17</a> « Servir et protéger les données. »</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn18" id="ftn18">18</a> Les applications qui tournent sur le système relationnel contiennent des bogues. Le système lui-même contient ses propres bogues. Enfin, les matériels peuvent dysfonctionner.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn19" id="ftn19">19</a> Une grappe de serveurs ou une ferme de calcul (<em>cluster</em> en anglais) consiste en un regroupement d’ordinateurs, appelés <em>nœuds</em>, qui collaborent pour résoudre un problème particulier.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn20" id="ftn20">20</a> <span lang="en">Sergueï Brin et Lawrence Page, « The anatomy of a large-scale hypertextual web search engine », </span><em><span lang="en">Proceedings of the 7</span></em><sup><em><span lang="en">th</span></em></sup><em><span lang="en"> International Conference on World Wide Web</span></em><span lang="en">, Amsterdam, Elsevier, 1998 ; </span><em><span lang="en">Computer Networks and ISDN Systems</span></em><span lang="en">, vol. 30, n</span><sup><span lang="en">o</span></sup><span lang="en"> 1-7, 1998, p. 107-117, </span><a href="http://dx.crossref.org/10.1016/S0169-7552(98)00110-X"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1016/S0169-7552(98)00110-X"><span lang="en"> : 10.1016/S0169-7552(98)00110-X</span></a><span lang="en">.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn21" id="ftn21">21</a> <span lang="en">Serge Abiteboul, Ioana Manolescu, Philippe Rigaux, Marie-Christine Rousset et Pierre Senellart, </span><em><span lang="en">Web Data Management</span></em><span lang="en">, Cambridge University Press, 2011 : </span><a href="http://webdam.inria.fr/Jorge"><span lang="en">http://webdam.inria.fr/Jorge</span></a><span lang="en">. </span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn22" id="ftn22">22</a> Google appelle ses centres de données, des <em>fermes</em>. Le nombre de fermes et le nombre de processeurs dans chaque ferme sont secrets. On parle de dizaines de fermes et des sources du début des années 2000 attribuaient à la plus grande ferme 6000 processeurs. </p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn23" id="ftn23">23</a> Ce problème fait partie de la classe AC0, c’est-à-dire la classe des problèmes que l’on peut résoudre avec des circuits de profondeur constante et un nombre de portes ET et OU polynomial dans la taille de l’entrée. L’évaluation de requêtes de l’algèbre relationnelle est d’ailleurs dans sa totalité dans AC0.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn24" id="ftn24">24</a> « <em>Playboy</em> : La devise de votre société est vraiment “Ne faites pas le mal” ? <em>Brin</em> : Oui, c’est vrai. <em>Playboy</em> : Est-ce un code écrit ? <em>Brin</em> : Oui. Nous avons d’autres règles, aussi. <em>Page</em> : Nous acceptons les chiens, par exemple. »</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn25" id="ftn25">25</a> <span lang="en">Jon M. Kleinberg, « Authoritative sources in a hyperlinked environment », </span><em><span lang="en">Journal of the ACM</span></em><span lang="en">, vol. 46, n</span><sup><span lang="en">o</span></sup><span lang="en"> 5, 1999, p. 604-632, </span><a href="http://dx.crossref.org/10.1145/324133.324140"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1145/324133.324140"><span lang="en"> : 10.1145/324133.324140</span></a><span lang="en">. </span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn26" id="ftn26">26</a> Une matrice est creuse si la plupart de ses coefficients sont à zéro. Pour un milliard de pages, si chaque page a une trentaine de liens en moyenne, la matrice a environ 30 milliards d’entrées non vides sur un milliard de milliards d’entrées. Elle est très creuse. Mais, même dans une représentation optimisée, elle reste gigantesque. </p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn27" id="ftn27">27</a> Le PageRank de Google actuel utiliserait des dizaines de critères combinés dans une formule gardée secrète.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn28" id="ftn28">28</a> <span lang="es">Serge Abiteboul, Mihai Preda et Grégory Cobena,</span><span lang="en"> « Adaptive on-line page importance computation »</span><span lang="es">, </span><em><span lang="es">Proceedings of the 12</span></em><sup><em><span lang="es">th</span></em></sup><em><span lang="es"> International Conference on World Wide Web</span></em><span lang="es">, New York, ACM, </span><span lang="en">2003, </span><a href="http://dx.crossref.org/10.1145/775152.775192"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1145/775152.775192"><span lang="en"> : 10.1145/775152.775192</span></a><span lang="en">.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn29" id="ftn29">29</a> Raphaël Meltz, « Marc L. Genèse d’un buzz médiatique », <a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html"><em>Le Tigre</em></a><a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html">, n</a><a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html"><sup>o</sup></a><a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html"> 31, mars-avril 2009</a>, p. 12-16. Voir aussi : <a href="http://www.le-tigre.net/Marc-L.html">http://www.le-tigre.net/Marc-L.html</a>.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn30" id="ftn30">30</a> Gloria Origgi, « Sagesse en réseaux : la passion d’évaluer », <em>La Vie des idées</em>, 30 septembre 2008 : <a href="http://www.laviedesidees.fr/Sagesse-en-reseaux-la-passion-d.html">http://www.laviedesidees.fr/Sagesse-en-reseaux-la-passion-d.html</a>.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn31" id="ftn31">31</a> <span lang="en">Alban Galland, Serge Abiteboul, Amélie Marian et Pierre Senellart, « </span><span lang="en">Corroborating information from disagreeing views »</span><span lang="en">, </span><em><span lang="en">Proceedings of the 3</span></em><sup><em><span lang="en">rd</span></em></sup><em><span lang="en"> ACM International Conference on Web Search and Data Mining</span></em><span lang="en">, New York, ACM, 2010, p. 131-140, </span><a href="http://dx.crossref.org/10.1145/1718487.1718504"><span lang="en" style="font-variant:small-caps;">doi </span></a><a href="http://dx.crossref.org/10.1145/1718487.1718504"><span lang="en">: 10.1145/1718487.1718504</span></a><span lang="en">.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn32" id="ftn32">32</a> Wikipédia existe en 281 éditions et sa version anglaise a plus de 3 millions d’articles en juin 2011 (source : Wikipédia).</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn33" id="ftn33">33</a> Les traductions trouvées sur la Toile, comme « externalisation ouverte », ne nous ont pas convaincu.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn34" id="ftn34">34</a> Référence au « Turc mécanique », un automate joueur d’échecs de la fin du <span style="font-variant:small-caps;">xviii</span><sup>e</sup> siècle, en réalité un canular. </p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn35" id="ftn35">35</a> <span lang="en">Seth Cooper </span><em><span lang="en">et al.</span></em><span lang="en">, « Predicting protein structures with a multiplayer online game », </span><em><span lang="en">Nature</span></em><span lang="en">, vol. 466, 2010, p. 756-760, </span><a href="http://dx.crossref.org/10.1038/nature09304"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1038/nature09304"><span lang="en"> : 10.1038/nature09304</span></a><span lang="en">.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn36" id="ftn36">36</a> « Les masses sont les véritables héros. »</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn37" id="ftn37">37</a> « Mais de l’arbre de la connaissance du bien et du mal, tu n’en mangeras pas ; car, au jour que tu en mangeras, tu mourras certainement. » Genèse 2:17.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn38" id="ftn38">38</a> Johannes Hoffart, Fabian M. Suchanek, Klaus Berberich et Gerhard Weikum,<em> YAGO2 : A Spatially and Temporally Enhanced Knowledge Base from Wikipedia</em>, Max-Planck-Institut für Informatik, novembre 2010 : <a href="http://mpi-inf.mpg.de/yago-naga/yago">www.mpi-inf.mpg.de/yago-naga/yago</a>.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn39" id="ftn39">39</a> Laurent Vieille, « Recursive axioms in deductive databases. The query/subquery approach », <em>Expert Database Conference</em>, 1986, p. 253-267.</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn40" id="ftn40">40</a> « Où est la sagesse que nous avons perdue dans la connaissance ? Où est cette connaissance que nous avons perdue en information ? »</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn41" id="ftn41">41</a> La <em>neutralité</em> est le principe qui garantit l’égalité de traitement de tous les flux de données sur Internet. Ce principe exclut toute discrimination à l’égard de la source, de la destination ou du contenu de l’information transmise sur le réseau (source : Wikipédia).</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn42" id="ftn42">42</a> Chris Anderson et Michael Wolff, <span lang="en">« The Web is dead. Long live the Internet », </span><em><span lang="en">Wired</span></em><span lang="en">, septembre 2010 : </span><a href="http://wired.com/"><span lang="en">www.wired.com</span></a><span lang="en">.</span></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn43" id="ftn43">43</a> En France, en 2009, 40 % de la population n’utilisait jamais l’informatique (source : CREDOC).</p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn44" id="ftn44">44</a> <span lang="en">Nicholas Carr, « Is Google making us stupid ? », </span><em><span lang="en">The Atlantic</span></em><span lang="en">, juillet/août 2008 : </span><a href="http://www.theatlantic.com/magazine/archive/2008/07/is-google-making-us-stupid/6868/"><span lang="en">http://www.theatlantic.com/magazine/archive/2008/07/is-google-making-us-stupid/6868/</span></a></p><p class="notesbaspage"><a class="FootnoteSymbol" href="#bodyftn45" id="ftn45">45</a> « Il est difficile de faire des prévisions, surtout pour l’avenir. »</p></div> </div> <div id="anchor-persons" class="mb-3 scrollspy-target anchor--toc--section"> <h1 class="title--alt bottom"> Auteur </h1> <div > <a href="/cdf/person/507"> <strong> Serge Abiteboul </strong> </a> </div> </div> <div class="widget--select2 desktop"> <label for="chapter-navigation-2" class="widget--select2__label"> Naviguer dans le livre </label> <div class="widget--select2__block"> <a class="widget--select2__button" href="/cdf/528" title="Présentation de Serge Abiteboul"><i class="fas fa-chevron-left me-2"></i>Précédent</a> <select id="chapter-navigation-2" class="select2" style="width: 100%"> <option class="px-3" value="/cdf/528" title="Présentation de Serge Abiteboul" > Présentation de Serge Abiteboul </option> <option class="px-3" value="/cdf/529" title="Sciences des données : de la logique du premier ordre à la Toile" selected> <span xml:lang="fr" lang="fr">Sciences des données : de la logique du premier ordre à la Toile</span> </option> </select> <a class="widget--select2__button widget--select2__button--disabled" aria-disabled="true" disabled>Suivant<i class="fas fa-chevron-right ms-2"></i></a> </div> </div> <div class="widget--select2 mobile"> <div class="widget--select2__block"> <a class="widget--select2__button" href="/cdf/528" title="Présentation de Serge Abiteboul"><i class="fas fa-chevron-left"></i></a> <a class="widget--select2__button w-100" href="/cdf/506?format=toc" title="Sciences des données : de la logique du premier ordre à la Toile">Table des matières</a> <a class="widget--select2__button widget--select2__button--disabled" aria-disabled="true" disabled><i class="fas fa-chevron-right"></i></a> </div> </div> <hr class="separator" /> <div class="mb-3"> <p> Le texte seul est utilisable sous licence <a href="https://www.openedition.org/12554">Licence OpenEdition Books</a>. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire. </p> </div> <div class="tab tab--large mt-4" id="tab-3"> <button class="tab__item--large tab__item--large--active" data-index="1" data-intertitle="h1"> <h1> Dans la même collection </h1> </button> <button class="tab__item--large " data-index="2" data-intertitle="h1"> De la même personne </button> </div> <div class="tab__values" id="tab-3-values"> <div class="tab__values__value tab__values__value--active" id="tab-3-value-1"> <div class="content content--module module--lg border rounded--light--bottom content--module--related" id="module-1"> <div class="module__bottom module__bottom--same_collection"> <div class="module__pagination module__pagination--related" data-module-related="1" data-pages="4" data-translations="{"current_page":"Page s\u00e9lectionn\u00e9e","go_to_the_page":"lodel.core.front.links.go_to_the_page"}"> <button id="module-previous-1" class="widget__nav__button widget__nav__button--arrow widget__nav__button--prev" aria-label="Page précédente"> <i class="fas fa-chevron-left"></i> </button> <button class="widget__nav__button widget__nav__button--navigation module__pagination__button module-1__pagination__button widget__nav__button--navigation--active" id="module-1-button-1" data-page-number="1" aria-label="Page sélectionnée (1)"> <span></span> </button> <button class="widget__nav__button widget__nav__button--navigation module__pagination__button module-1__pagination__button " id="module-1-button-2" data-page-number="2" aria-label="lodel.core.front.links.go_to_the_page 2"> <span></span> </button> <button class="widget__nav__button widget__nav__button--navigation module__pagination__button module-1__pagination__button " id="module-1-button-3" data-page-number="3" aria-label="lodel.core.front.links.go_to_the_page 3"> <span></span> </button> <button class="widget__nav__button widget__nav__button--navigation module__pagination__button module-1__pagination__button " id="module-1-button-4" data-page-number="4" aria-label="lodel.core.front.links.go_to_the_page 4"> <span></span> </button> <button id="module-next-1" class="widget__nav__button widget__nav__button--arrow widget__nav__button--next" aria-label="Page suivante"> <i class="fas fa-chevron-right"></i> </button> </div> <a class="module__bottom__link" href="/cdf/156"><i class="fas fa-arrow-right"></i> Voir plus de livres </a> </div> <div class="module__list"> <div class="module__list__item module__list__item--width module-1__page " data-module-page="module-1-page-1"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/183" title="Les cornes de Moïse. Faire entrer la Bible dans l’histoire"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Les cornes de Moïse. Faire entrer la Bible dans l’histoire" src="/cdf/file/278/cover/couvliromer.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/183" title="Les cornes de Moïse. Faire entrer la Bible dans l’histoire"> Les cornes de Moïse. Faire entrer la Bible dans l’histoire </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Thomas Römer </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div class="module__list__item module__list__item--width module-1__page " data-module-page="module-1-page-1"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/184" title="La Chine pense-t-elle ?"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="La Chine pense-t-elle ?" src="/cdf/file/277/cover/couvlicheng.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/184" title="La Chine pense-t-elle ?"> La Chine pense-t-elle ? </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 11 décembre 2008</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Anne Cheng </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div class="module__list__item module__list__item--width module-1__page " data-module-page="module-1-page-1"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/187" title="Origine et histoire des hominidés. Nouveaux paradigmes"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Origine et histoire des hominidés. Nouveaux paradigmes" src="/cdf/file/275/cover/couvlibrunet.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/187" title="Origine et histoire des hominidés. Nouveaux paradigmes"> Origine et histoire des hominidés. Nouveaux paradigmes </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 27 mars 2008</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Michel Brunet </span> </p> <p class="module--un__text__info__date">2008</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-2"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/188" title="L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement" src="/cdf/file/280/cover/couvlipiot.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/188" title="L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement"> L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Peter Piot </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-2"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/189" title="Gérer les changements climatiques. Climat, croissance, développement et équité"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Gérer les changements climatiques. Climat, croissance, développement et équité" src="/cdf/file/282/cover/couvlistern.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/189" title="Gérer les changements climatiques. Climat, croissance, développement et équité"> Gérer les changements climatiques. Climat, croissance, développement et équité </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Nicholas Stern </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-2"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/191" title="Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ?"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ?" src="/cdf/file/281/cover/couvlicouvreur.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/191" title="Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ?"> Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ? </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Patrick Couvreur </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-3"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/193" title="Des microbes et des hommes. Guerre et paix aux surfaces muqueuses"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Des microbes et des hommes. Guerre et paix aux surfaces muqueuses" src="/cdf/file/276/cover/li_sansonetti_couv_2.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/193" title="Des microbes et des hommes. Guerre et paix aux surfaces muqueuses"> Des microbes et des hommes. Guerre et paix aux surfaces muqueuses </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 20 novembre 2008</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Philippe Sansonetti </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-3"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/195" title="Chimie des processus biologiques : une introduction"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Chimie des processus biologiques : une introduction" src="/cdf/file/279/cover/li_fontecave_couv.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/195" title="Chimie des processus biologiques : une introduction"> Chimie des processus biologiques : une introduction </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Marc Fontecave </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-3"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/334" title="De l’atome au matériau. Les phénomènes quantiques collectifs"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="De l’atome au matériau. Les phénomènes quantiques collectifs" src="/cdf/file/348/cover/couvligeroges.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/334" title="De l’atome au matériau. Les phénomènes quantiques collectifs"> De l’atome au matériau. Les phénomènes quantiques collectifs </a> </h2> <p class="content__list__item__subtitle">From the atom to matter. Collective quantum phenomena</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Antoine Georges </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-4"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/386" title="L’art survivra à ses ruines"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="L’art survivra à ses ruines" src="/cdf/file/388/cover/couvlikiefer.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/386" title="L’art survivra à ses ruines"> L’art survivra à ses ruines </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Anselm Kiefer </span> </p> <p class="module--un__text__info__date">2011</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-4"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/389" title="Le théâtre n’existe pas"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Le théâtre n’existe pas" src="/cdf/file/391/cover/couvlinichet.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/389" title="Le théâtre n’existe pas"> Le théâtre n’existe pas </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Jacques Nichet </span> </p> <p class="module--un__text__info__date">2011</p> </div> <div class="module__list__item module__list__item--width module-1__page module__list__item--hidden" data-module-page="module-1-page-4"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/399" title="L’énergie : stockage électrochimique et développement durable"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="L’énergie : stockage électrochimique et développement durable" src="/cdf/file/406/cover/couvlitarascon.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/399" title="L’énergie : stockage électrochimique et développement durable"> L’énergie : stockage électrochimique et développement durable </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Jean-Marie Tarascon </span> </p> <p class="module--un__text__info__date">2011</p> </div> </div> </div> <div class="module module--sm" id="module-1-sm"> <div class="content content--module content--module--mobile border-start border-bottom border-end rounded--light"> <div class="module__header--mobile"> <div class="module__header__left--mobile"> <a class="module__bottom__link module__bottom__link--mobile" href="/cdf/156"> <i class="fas fa-arrow-right"></i> Voir plus de livres </a> </div> <div class="module__pagination--mobile" data-module-related="1" data-pages="12"> <button id="module-previous-1-sm" class="module__pagination--mobile__arrow module__pagination--mobile__arrow-1 rounded--light" data-direction="previous" aria-label="Page précédente"> <i class="fas fa-chevron-left"></i> </button> <div class="module__pagination--mobile__count"> <span id="module-1-current-sm">1</span> <span> / 12</span> </div> <button id="module-next-1-sm" class="module__pagination--mobile__arrow module__pagination--mobile__arrow-1 rounded--light" data-direction="next" aria-label="Page suivante"> <i class="fas fa-chevron-right"></i> </button> </div> </div> <div id="module--mobile-1" class="module--mobile" data-module-id="1" data-last-page="12"> <div id="module--mobile-1__item-1" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/183" title="Les cornes de Moïse. Faire entrer la Bible dans l’histoire"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Les cornes de Moïse. Faire entrer la Bible dans l’histoire" src="/cdf/file/278/cover/couvliromer.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/183" title="Les cornes de Moïse. Faire entrer la Bible dans l’histoire"> Les cornes de Moïse. Faire entrer la Bible dans l’histoire </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Thomas Römer </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div id="module--mobile-1__item-2" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/184" title="La Chine pense-t-elle ?"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="La Chine pense-t-elle ?" src="/cdf/file/277/cover/couvlicheng.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/184" title="La Chine pense-t-elle ?"> La Chine pense-t-elle ? </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 11 décembre 2008</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Anne Cheng </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div id="module--mobile-1__item-3" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/187" title="Origine et histoire des hominidés. Nouveaux paradigmes"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Origine et histoire des hominidés. Nouveaux paradigmes" src="/cdf/file/275/cover/couvlibrunet.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/187" title="Origine et histoire des hominidés. Nouveaux paradigmes"> Origine et histoire des hominidés. Nouveaux paradigmes </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 27 mars 2008</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Michel Brunet </span> </p> <p class="module--un__text__info__date">2008</p> </div> <div id="module--mobile-1__item-4" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/188" title="L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement" src="/cdf/file/280/cover/couvlipiot.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/188" title="L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement"> L’épidémie du sida. Mondialisation des risques, transformations de la santé publique et développement </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Peter Piot </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div id="module--mobile-1__item-5" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/189" title="Gérer les changements climatiques. Climat, croissance, développement et équité"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Gérer les changements climatiques. Climat, croissance, développement et équité" src="/cdf/file/282/cover/couvlistern.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/189" title="Gérer les changements climatiques. Climat, croissance, développement et équité"> Gérer les changements climatiques. Climat, croissance, développement et équité </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Nicholas Stern </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div id="module--mobile-1__item-6" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/191" title="Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ?"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ?" src="/cdf/file/281/cover/couvlicouvreur.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/191" title="Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ?"> Les nanotechnologies peuvent-elles contribuer à traiter des maladies sévères ? </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Patrick Couvreur </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div id="module--mobile-1__item-7" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/193" title="Des microbes et des hommes. Guerre et paix aux surfaces muqueuses"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Des microbes et des hommes. Guerre et paix aux surfaces muqueuses" src="/cdf/file/276/cover/li_sansonetti_couv_2.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/193" title="Des microbes et des hommes. Guerre et paix aux surfaces muqueuses"> Des microbes et des hommes. Guerre et paix aux surfaces muqueuses </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 20 novembre 2008</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Philippe Sansonetti </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div id="module--mobile-1__item-8" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/195" title="Chimie des processus biologiques : une introduction"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Chimie des processus biologiques : une introduction" src="/cdf/file/279/cover/li_fontecave_couv.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/195" title="Chimie des processus biologiques : une introduction"> Chimie des processus biologiques : une introduction </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Marc Fontecave </span> </p> <p class="module--un__text__info__date">2009</p> </div> <div id="module--mobile-1__item-9" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/334" title="De l’atome au matériau. Les phénomènes quantiques collectifs"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="De l’atome au matériau. Les phénomènes quantiques collectifs" src="/cdf/file/348/cover/couvligeroges.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/334" title="De l’atome au matériau. Les phénomènes quantiques collectifs"> De l’atome au matériau. Les phénomènes quantiques collectifs </a> </h2> <p class="content__list__item__subtitle">From the atom to matter. Collective quantum phenomena</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Antoine Georges </span> </p> <p class="module--un__text__info__date">2010</p> </div> <div id="module--mobile-1__item-10" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/386" title="L’art survivra à ses ruines"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="L’art survivra à ses ruines" src="/cdf/file/388/cover/couvlikiefer.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/386" title="L’art survivra à ses ruines"> L’art survivra à ses ruines </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Anselm Kiefer </span> </p> <p class="module--un__text__info__date">2011</p> </div> <div id="module--mobile-1__item-11" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/389" title="Le théâtre n’existe pas"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Le théâtre n’existe pas" src="/cdf/file/391/cover/couvlinichet.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/389" title="Le théâtre n’existe pas"> Le théâtre n’existe pas </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Jacques Nichet </span> </p> <p class="module--un__text__info__date">2011</p> </div> <div id="module--mobile-1__item-12" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/399" title="L’énergie : stockage électrochimique et développement durable"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="L’énergie : stockage électrochimique et développement durable" src="/cdf/file/406/cover/couvlitarascon.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/399" title="L’énergie : stockage électrochimique et développement durable"> L’énergie : stockage électrochimique et développement durable </a> </h2> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Jean-Marie Tarascon </span> </p> <p class="module--un__text__info__date">2011</p> </div> </div> </div> </div> </div> <div class="content--widget tab__values__value " id="tab-3-value-2"> <div class="subtab subtab--module border-start border-end" id="subtab-1"> <button class="subtab__item subtab__item--active" data-index="1"> Livres </button> <button class="subtab__item" data-index="2"> Chapitre </button> </div> <div class="subtab__values" id="subtab-1-values"> <div class="subtab__values__value" id="subtab-1-value-1"> <div class="content content--module module--lg border-start border-bottom border-end rounded--light--bottom content--module--related" id="module-2"> <div class="module__bottom module__bottom--related"> <a class="module__bottom__link" href="/cdf/person/507"> <i class="fas fa-arrow-right"></i> Voir plus de livres </a> </div> <div class="module__list"> <div class="module__list__item module__list__item--width module-2__page " data-module-page="module-2-page-1"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/506" title="Sciences des données : de la logique du premier ordre à la Toile"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Sciences des données : de la logique du premier ordre à la Toile" src="/cdf/file/530/cover/couvliabiteboul.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/506" title="Sciences des données : de la logique du premier ordre à la Toile"> Sciences des données : de la logique du premier ordre à la Toile </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 8 mars 2012</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Serge Abiteboul </span> </p> <p class="module--un__text__info__date">2012</p> </div> <div class="module__list__item module__list__item--width module-2__page " data-module-page="module-2-page-1"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/556" title="Data Sciences: From First-Order Logic to the Web"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Data Sciences: From First-Order Logic to the Web" src="/cdf/file/557/cover/li_abiteboul_couv_en_corr.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/556" title="Data Sciences: From First-Order Logic to the Web"> Data Sciences: From First-Order Logic to the Web </a> </h2> <p class="content__list__item__subtitle">Inaugural lecture given on Thursday 8 March 2012</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Serge Abiteboul </span> <span class="content__list__item__persons__type"> Liz Libbrecht (trad.) </span> </p> <p class="module--un__text__info__date">2012</p> </div> </div> </div> <div class="module module--sm" id="module-2-sm"> <div class="content content--module content--module--mobile border-start border-bottom border-end rounded--light"> <div class="module__header--mobile"> <div class="module__header__left--mobile"> <a class="module__bottom__link module__bottom__link--mobile" href="/cdf/person/507"> <i class="fas fa-arrow-right"></i> Voir plus de livres </a> </div> <div class="module__pagination--mobile" data-module-related="2" data-pages="2"> <button id="module-previous-2-sm" class="module__pagination--mobile__arrow module__pagination--mobile__arrow-2 rounded--light" data-direction="previous" aria-label="Page précédente"> <i class="fas fa-chevron-left"></i> </button> <div class="module__pagination--mobile__count"> <span id="module-2-current-sm">1</span> <span> / 2</span> </div> <button id="module-next-2-sm" class="module__pagination--mobile__arrow module__pagination--mobile__arrow-2 rounded--light" data-direction="next" aria-label="Page précédente"> <i class="fas fa-chevron-right"></i> </button> </div> </div> <div id="module--mobile-2" class="module--mobile " data-module-id="2" data-last-page="2"> <div id="module--mobile-2__item-1" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/506" title="Sciences des données : de la logique du premier ordre à la Toile"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Sciences des données : de la logique du premier ordre à la Toile" src="/cdf/file/530/cover/couvliabiteboul.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/506" title="Sciences des données : de la logique du premier ordre à la Toile"> Sciences des données : de la logique du premier ordre à la Toile </a> </h2> <p class="content__list__item__subtitle">Leçon inaugurale prononcée le jeudi 8 mars 2012</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Serge Abiteboul </span> </p> <p class="module--un__text__info__date">2012</p> </div> <div id="module--mobile-2__item-2" class="module__list__item module--mobile__item"> <div class="content__list__item__cover module__list__item__cover"> <a class="content__list__item__cover__link text-decoration-none" href="/cdf/556" title="Data Sciences: From First-Order Logic to the Web"> <img class="content__list__item__cover__img content__list__item__cover__img--module" alt="Data Sciences: From First-Order Logic to the Web" src="/cdf/file/557/cover/li_abiteboul_couv_en_corr.jpg/download/200" loading="lazy" /> </a> </div> <h2 class="content__list__item__title"> <a href="/cdf/556" title="Data Sciences: From First-Order Logic to the Web"> Data Sciences: From First-Order Logic to the Web </a> </h2> <p class="content__list__item__subtitle">Inaugural lecture given on Thursday 8 March 2012</p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Serge Abiteboul </span> <span class="content__list__item__persons__type"> Liz Libbrecht (trad.) </span> </p> <p class="module--un__text__info__date">2012</p> </div> </div> </div> </div> </div> <div class="subtab__values__value" id="subtab-1-value-2"> <div class="content content--module module--lg border-start border-bottom border-end rounded--light--bottom content--module--related" id="module-3"> <div class="module__bottom module__bottom--related"> <a class="module__bottom__link" href="/cdf/person/507"> <i class="fas fa-arrow-right"></i> Voir plus de chapitres </a> </div> <div class="module__list"> <div class="module__list__item module__list__item--width module-3__page " data-module-page="module-3-page-1"> <h2 class="content__list__item__title"> <a href="/cdf/560" title="Data Sciences: From First Order Logic to the Web"> <span xml:lang="en" lang="en">Data Sciences: From First Order Logic to the Web</span> </a> </h2> <p class="content__list__item__subtitle"><span xml:lang="en" lang="en">Inaugural lecture given on Thursday 8 March 2012</span></p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Serge Abiteboul </span> </p> </div> </div> </div> <div class="module module--sm" id="module-3-sm"> <div class="content content--module content--module--mobile border-start border-bottom border-end rounded--light"> <div class="module__header--mobile"> <div class="module__header__left--mobile"> <a class="module__bottom__link module__bottom__link--mobile" href="/cdf/person/507"> <i class="fas fa-arrow-right"></i> Voir plus de chapitres </a> </div> </div> <div id="module--mobile-3" class="module--mobile scroll-disabled" data-module-id="3" data-last-page="1"> <div id="module--mobile-3__item-1" class="module__list__item module--mobile__item"> <h2 class="content__list__item__title"> <a href="/cdf/560" title="Data Sciences: From First Order Logic to the Web"> <span xml:lang="en" lang="en">Data Sciences: From First Order Logic to the Web</span> </a> </h2> <p class="content__list__item__subtitle"><span xml:lang="en" lang="en">Inaugural lecture given on Thursday 8 March 2012</span></p> <p class="content__list__item__persons"> <span class="content__list__item__persons__type"> Serge Abiteboul </span> </p> </div> </div> </div> </div> </div> </div> </div> </div> </div> </div> <div class="column--read column--read--desktop"> <div class="widget--column"> <div class="widget--column__freemium"> <div class="widget--column__freemium__logo"> <img class="widget--column__freemium__logo__img--small" src="/assets/images/openaccess-logo.png" title="Accès ouvert tout format" alt="Accès ouvert tout format" loading="lazy" /> </div> <p class="widget--column__freemium__title">Accès ouvert freemium</p> </div> <div class="widget--column__list list"> <div class="widget--column__list__item"> <a class="download_epub3" title="EPUB3 Sciences des données : de la logique du premier ordre à la Toile" data-translation="ePub"> <div class="widget--column__list__item__icon"> <i class="fa-solid fa-tablet-alt"></i> <div class="widget--column__list__item__icon__status pdf_epub_button" data-site="cdf" data-contentid="506" data-format="epub3" data-target="epub3"> <i class="fas fa-times-circle widget--column__list__item__icon__status__color widget--column__list__item__icon__status__color--red"></i> </div> </div> <p class="widget--column__list__item__title">ePub</p> </a> </div> <div class="widget--column__list__item"> <a class="download_pdf" title="PDF Sciences des données : de la logique du premier ordre à la Toile" data-translation="PDF"> <div class="widget--column__list__item__icon"> <i class="fa-solid fa-file-pdf"></i> <div class="widget--column__list__item__icon__status pdf_epub_button" data-site="cdf" data-contentid="506" data-format="pdf" data-target="pdf"> <i class="fas fa-times-circle widget--column__list__item__icon__status__color widget--column__list__item__icon__status__color--red"></i> </div> </div> <p class="widget--column__list__item__title">PDF</p> </a> </div> <div class="widget--column__list__item"> <a class="download_chapter_pdf" title="CHAPTER_PDF Sciences des données : de la logique du premier ordre à la Toile" data-translation="PDF du chapitre"> <div class="widget--column__list__item__icon"> <i class="fa-solid fa-file-pdf"></i> <div class="widget--column__list__item__icon__status pdf_epub_button" data-site="cdf" data-contentid="529" data-format="pdf" data-target="chapter_pdf"> <i class="fas fa-times-circle widget--column__list__item__icon__status__color widget--column__list__item__icon__status__color--red"></i> </div> </div> <p class="widget--column__list__item__title">PDF du chapitre</p> </a> </div> </div> </div> <div class="widget--buy"> <p class="widget--buy__title"> Acheter </p> <div class="widget--buy__body"><p class="widget--buy__body__subtitle"><i class="fa-solid fa-book-open"></i> Édition imprimée </p><div class="widget--buy__body__links"><a class="widget--buy__body__links__link" href="https://www.amazon.fr/dp/2213669104?tag=openeditionor-21&linkCode=ogi&th=1&psc=1"> amazon.fr </a><a class="widget--buy__body__links__link" href="https://www.decitre.fr/9782213669106.html?utm_source=affilae&utm_medium=affiliation&utm_campaign=revues#ae228"> decitre.fr </a><a class="widget--buy__body__links__link" href="https://www.mollat.com/livres/1400841/serge-abiteboul-sciences-des-donnees-de-la-logique-du-premier-ordre-a-la-toile"> mollat.com </a><a class="widget--buy__body__links__link" href="https://www.leslibraires.fr/livre/9782213669106"> leslibraires.fr </a><a class="widget--buy__body__links__link" href="https://www.placedeslibraires.fr/livre/9782213669106-sciences-des-donnees-de-la-logique-du-premier-ordre-a-la-toile-serge-abiteboul/"> placedeslibraires.fr </a></div></div><div class="widget--buy__elec"><i class="fa-solid fa-tablet-alt"></i><i class="fa-solid fa-file-pdf"></i><a class="widget--buy__elec__link" href="https://www.7switch.com/fr/ebook/9782722601710/from/openedition"> ePub / PDF </a></div> </div> </div> </div> <div class="note__wrapper hidden"> <div class="note__container"> <div class="note__content"> <p><a href="#bodyftn1">1</a> Gérard Berry, <em>Pourquoi et comment le monde devient numérique</em>, Collège de France / Fayard, coll. « Leçons inaugurales », n<sup>o</sup> 197, 2008.</p><p><a href="#bodyftn2">2</a> Gérard Berry, <em>Penser, modéliser et maîtriser le calcul informatique</em>, Collège de France / Fayard, coll. « Leçons inaugurales », n<sup>o</sup> 208, 2010. <br/>Martin Abadi, <em>La Sécurité informatique</em>, Collège de France / Fayard, n<sup>o</sup> 219, 2011, <a href="http://dx.crossref.org/10.4000/lecons-cdf.443"><span style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.4000/lecons-cdf.443"> : 10.4000/lecons-cdf.443</a>.</p><p><a href="#bodyftn3">3</a> Nous entendons par langues « naturelles » des langues élaborées dans le temps par des groupes de locuteurs, comme le français ou l’anglais. Ceci est moins en opposition avec des langues « construites » comme l’espéranto, qu’avec des langages formels comme la logique du premier ordre, SQL ou Java.</p><p><a href="#bodyftn4">4</a> « Écoute Dave. Je vois bien que tu es très affecté par tout cela. Et je pense vraiment que tu devrais reprendre tes esprits, prendre un calmant et essayer de faire le point. »</p><p><a href="#bodyftn5">5</a> Définir précisément ces notions n’est pas chose facile. Voir par exemple : Luciano Floridi, <em><span lang="en">The Philosophy of Information</span></em><span lang="en">, Oxford University Press, 2011.</span></p><p><a href="#bodyftn6">6</a> Ses données persistent après que l’ordinateur a été éteint.</p><p><a href="#bodyftn7">7</a> Les évolutions suivantes ont été observées approximativement jusqu’à présent. Concernant les capacités de stockage, la densité de mémoire des disques durs double chaque année (loi de Kryder). Quant aux circuits, la densité de transistors sur une puce de silicium double tous les deux ans (loi de Moore). </p><p><a href="#bodyftn8">8</a> <a href="http://michaelbrodie.com/">http://michaelbrodie.com</a>.</p><p><a href="#bodyftn9">9</a> « La logique est le commencement de la sagesse, pas sa fin. »</p><p><a href="#bodyftn10">10</a> <span lang="en">Serge Abiteboul, Richard Hull et Victor Vianu, </span><em><span lang="en">Foundations of Databases</span></em><span lang="en">, Addison-Wesley, 1995 : </span><a href="http://webdam.inria.fr/Alice"><span lang="en">http://webdam.inria.fr/Alice</span></a><span lang="en">. <br/></span>Michael Benedikt et Pierre Senellart, « Databases », in E. K. Blum et A. V. Aho (dir.), <em>Computer Science. </em><em><span lang="en">The Hardware, Software and Heart of It</span></em><span lang="en">, Springer-Verlag, 2012, p. 169-229, </span><a href="http://dx.crossref.org/10.1007/978-1-4614-1168-0_10"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1007/978-1-4614-1168-0_10"><span lang="en"> : 10.1007/978-1-4614-1168-0_10</span></a><span lang="en">.</span></p><p><a href="#bodyftn11">11</a> SQL va plus loin que le calcul relationnel. Par exemple, il permet d’ordonner les résultats et d’appliquer des fonctions simples comme la somme ou la moyenne.</p><p><a href="#bodyftn12">12</a> Pour ces complexités « faibles », le modèle de calcul précis est important. Nous parlons ici de calcul sur des machines RAM. </p><p><a href="#bodyftn13">13</a> Un exemple de problème difficile dans <em>NP</em> est celui du <em>voyageur de commerce </em>: étant donné des villes, des routes entre ces villes, et les longueurs de ces routes, comment trouver le plus court chemin pour relier toutes les villes.</p><p><a href="#bodyftn14">14</a> Comme il y a un nombre fini d’états possibles, il est possible de détecter si le programme est entré dans une boucle, mais au prix d’un travail supplémentaire. </p><p><a href="#bodyftn15">15</a> <span lang="en">Serge Abiteboul et Victor Vianu, « Generic computation and its complexity », </span><em><span lang="en">Proceedings of the 23</span></em><sup><em><span lang="en">rd</span></em></sup><em><span lang="en"> annual ACM symposium on theory of computing</span></em><span lang="en">, New York, ACM, 1991, p. 209-219, </span><a href="http://dx.crossref.org/10.1145/103418.103444"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1145/103418.103444"><span lang="en"> : 10.1145/103418.103444</span></a><span lang="en">.</span></p><p><a href="#bodyftn16">16</a> Dans notre discussion, nous supposons que le domaine n’est pas ordonné. Le problème est différent si nous considérons que le domaine est ordonné. Vardi a montré que <em>fixpoint</em> permet de calculer exactement toutes les requêtes dans <em>P</em>, et que <em>while</em> exprime exactement<em> </em>les requêtes dans<em> pspace</em>.</p><p><a href="#bodyftn17">17</a> « Servir et protéger les données. »</p><p><a href="#bodyftn18">18</a> Les applications qui tournent sur le système relationnel contiennent des bogues. Le système lui-même contient ses propres bogues. Enfin, les matériels peuvent dysfonctionner.</p><p><a href="#bodyftn19">19</a> Une grappe de serveurs ou une ferme de calcul (<em>cluster</em> en anglais) consiste en un regroupement d’ordinateurs, appelés <em>nœuds</em>, qui collaborent pour résoudre un problème particulier.</p><p><a href="#bodyftn20">20</a> <span lang="en">Sergueï Brin et Lawrence Page, « The anatomy of a large-scale hypertextual web search engine », </span><em><span lang="en">Proceedings of the 7</span></em><sup><em><span lang="en">th</span></em></sup><em><span lang="en"> International Conference on World Wide Web</span></em><span lang="en">, Amsterdam, Elsevier, 1998 ; </span><em><span lang="en">Computer Networks and ISDN Systems</span></em><span lang="en">, vol. 30, n</span><sup><span lang="en">o</span></sup><span lang="en"> 1-7, 1998, p. 107-117, </span><a href="http://dx.crossref.org/10.1016/S0169-7552(98)00110-X"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1016/S0169-7552(98)00110-X"><span lang="en"> : 10.1016/S0169-7552(98)00110-X</span></a><span lang="en">.</span></p><p><a href="#bodyftn21">21</a> <span lang="en">Serge Abiteboul, Ioana Manolescu, Philippe Rigaux, Marie-Christine Rousset et Pierre Senellart, </span><em><span lang="en">Web Data Management</span></em><span lang="en">, Cambridge University Press, 2011 : </span><a href="http://webdam.inria.fr/Jorge"><span lang="en">http://webdam.inria.fr/Jorge</span></a><span lang="en">. </span></p><p><a href="#bodyftn22">22</a> Google appelle ses centres de données, des <em>fermes</em>. Le nombre de fermes et le nombre de processeurs dans chaque ferme sont secrets. On parle de dizaines de fermes et des sources du début des années 2000 attribuaient à la plus grande ferme 6000 processeurs. </p><p><a href="#bodyftn23">23</a> Ce problème fait partie de la classe AC0, c’est-à-dire la classe des problèmes que l’on peut résoudre avec des circuits de profondeur constante et un nombre de portes ET et OU polynomial dans la taille de l’entrée. L’évaluation de requêtes de l’algèbre relationnelle est d’ailleurs dans sa totalité dans AC0.</p><p><a href="#bodyftn24">24</a> « <em>Playboy</em> : La devise de votre société est vraiment “Ne faites pas le mal” ? <em>Brin</em> : Oui, c’est vrai. <em>Playboy</em> : Est-ce un code écrit ? <em>Brin</em> : Oui. Nous avons d’autres règles, aussi. <em>Page</em> : Nous acceptons les chiens, par exemple. »</p><p><a href="#bodyftn25">25</a> <span lang="en">Jon M. Kleinberg, « Authoritative sources in a hyperlinked environment », </span><em><span lang="en">Journal of the ACM</span></em><span lang="en">, vol. 46, n</span><sup><span lang="en">o</span></sup><span lang="en"> 5, 1999, p. 604-632, </span><a href="http://dx.crossref.org/10.1145/324133.324140"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1145/324133.324140"><span lang="en"> : 10.1145/324133.324140</span></a><span lang="en">. </span></p><p><a href="#bodyftn26">26</a> Une matrice est creuse si la plupart de ses coefficients sont à zéro. Pour un milliard de pages, si chaque page a une trentaine de liens en moyenne, la matrice a environ 30 milliards d’entrées non vides sur un milliard de milliards d’entrées. Elle est très creuse. Mais, même dans une représentation optimisée, elle reste gigantesque. </p><p><a href="#bodyftn27">27</a> Le PageRank de Google actuel utiliserait des dizaines de critères combinés dans une formule gardée secrète.</p><p><a href="#bodyftn28">28</a> <span lang="es">Serge Abiteboul, Mihai Preda et Grégory Cobena,</span><span lang="en"> « Adaptive on-line page importance computation »</span><span lang="es">, </span><em><span lang="es">Proceedings of the 12</span></em><sup><em><span lang="es">th</span></em></sup><em><span lang="es"> International Conference on World Wide Web</span></em><span lang="es">, New York, ACM, </span><span lang="en">2003, </span><a href="http://dx.crossref.org/10.1145/775152.775192"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1145/775152.775192"><span lang="en"> : 10.1145/775152.775192</span></a><span lang="en">.</span></p><p><a href="#bodyftn29">29</a> Raphaël Meltz, « Marc L. Genèse d’un buzz médiatique », <a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html"><em>Le Tigre</em></a><a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html">, n</a><a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html"><sup>o</sup></a><a href="http://www.le-tigre.net/Marc-L-Genese-d-un-buzz-mediatique.html"> 31, mars-avril 2009</a>, p. 12-16. Voir aussi : <a href="http://www.le-tigre.net/Marc-L.html">http://www.le-tigre.net/Marc-L.html</a>.</p><p><a href="#bodyftn30">30</a> Gloria Origgi, « Sagesse en réseaux : la passion d’évaluer », <em>La Vie des idées</em>, 30 septembre 2008 : <a href="http://www.laviedesidees.fr/Sagesse-en-reseaux-la-passion-d.html">http://www.laviedesidees.fr/Sagesse-en-reseaux-la-passion-d.html</a>.</p><p><a href="#bodyftn31">31</a> <span lang="en">Alban Galland, Serge Abiteboul, Amélie Marian et Pierre Senellart, « </span><span lang="en">Corroborating information from disagreeing views »</span><span lang="en">, </span><em><span lang="en">Proceedings of the 3</span></em><sup><em><span lang="en">rd</span></em></sup><em><span lang="en"> ACM International Conference on Web Search and Data Mining</span></em><span lang="en">, New York, ACM, 2010, p. 131-140, </span><a href="http://dx.crossref.org/10.1145/1718487.1718504"><span lang="en" style="font-variant:small-caps;">doi </span></a><a href="http://dx.crossref.org/10.1145/1718487.1718504"><span lang="en">: 10.1145/1718487.1718504</span></a><span lang="en">.</span></p><p><a href="#bodyftn32">32</a> Wikipédia existe en 281 éditions et sa version anglaise a plus de 3 millions d’articles en juin 2011 (source : Wikipédia).</p><p><a href="#bodyftn33">33</a> Les traductions trouvées sur la Toile, comme « externalisation ouverte », ne nous ont pas convaincu.</p><p><a href="#bodyftn34">34</a> Référence au « Turc mécanique », un automate joueur d’échecs de la fin du <span style="font-variant:small-caps;">xviii</span><sup>e</sup> siècle, en réalité un canular. </p><p><a href="#bodyftn35">35</a> <span lang="en">Seth Cooper </span><em><span lang="en">et al.</span></em><span lang="en">, « Predicting protein structures with a multiplayer online game », </span><em><span lang="en">Nature</span></em><span lang="en">, vol. 466, 2010, p. 756-760, </span><a href="http://dx.crossref.org/10.1038/nature09304"><span lang="en" style="font-variant:small-caps;">doi</span></a><a href="http://dx.crossref.org/10.1038/nature09304"><span lang="en"> : 10.1038/nature09304</span></a><span lang="en">.</span></p><p><a href="#bodyftn36">36</a> « Les masses sont les véritables héros. »</p><p><a href="#bodyftn37">37</a> « Mais de l’arbre de la connaissance du bien et du mal, tu n’en mangeras pas ; car, au jour que tu en mangeras, tu mourras certainement. » Genèse 2:17.</p><p><a href="#bodyftn38">38</a> Johannes Hoffart, Fabian M. Suchanek, Klaus Berberich et Gerhard Weikum,<em> YAGO2 : A Spatially and Temporally Enhanced Knowledge Base from Wikipedia</em>, Max-Planck-Institut für Informatik, novembre 2010 : <a href="http://mpi-inf.mpg.de/yago-naga/yago">www.mpi-inf.mpg.de/yago-naga/yago</a>.</p><p><a href="#bodyftn39">39</a> Laurent Vieille, « Recursive axioms in deductive databases. The query/subquery approach », <em>Expert Database Conference</em>, 1986, p. 253-267.</p><p><a href="#bodyftn40">40</a> « Où est la sagesse que nous avons perdue dans la connaissance ? Où est cette connaissance que nous avons perdue en information ? »</p><p><a href="#bodyftn41">41</a> La <em>neutralité</em> est le principe qui garantit l’égalité de traitement de tous les flux de données sur Internet. Ce principe exclut toute discrimination à l’égard de la source, de la destination ou du contenu de l’information transmise sur le réseau (source : Wikipédia).</p><p><a href="#bodyftn42">42</a> Chris Anderson et Michael Wolff, <span lang="en">« The Web is dead. Long live the Internet », </span><em><span lang="en">Wired</span></em><span lang="en">, septembre 2010 : </span><a href="http://wired.com/"><span lang="en">www.wired.com</span></a><span lang="en">.</span></p><p><a href="#bodyftn43">43</a> En France, en 2009, 40 % de la population n’utilisait jamais l’informatique (source : CREDOC).</p><p><a href="#bodyftn44">44</a> <span lang="en">Nicholas Carr, « Is Google making us stupid ? », </span><em><span lang="en">The Atlantic</span></em><span lang="en">, juillet/août 2008 : </span><a href="http://www.theatlantic.com/magazine/archive/2008/07/is-google-making-us-stupid/6868/"><span lang="en">http://www.theatlantic.com/magazine/archive/2008/07/is-google-making-us-stupid/6868/</span></a></p><p><a href="#bodyftn45">45</a> « Il est difficile de faire des prévisions, surtout pour l’avenir. »</p> </div> <a class="note__close"> <i class="fas fa-times"></i> </a> </div> </div> <script async defer crossorigin="anonymous" src="https://connect.facebook.net/fr_FR/sdk.js#xfbml=1&version=v14.0" nonce="b4y68rxG"></script> <div id="shareModal" class="modale modale--hidden" aria-hidden="true"> <div class="modale__background modale__close"></div> <div class="modale__content"> <div class="modale__content__header modale__header"> <div class="modale__content__header__title"> <p class="share__modal__header__left__info__title">Sciences des données : de la logique du premier ordre à la Toile</p> </div> <button type="button" class="modale__close modale__content__header__close tabindex--share" aria-label="Fermer" tabindex="-1"> <i class="fas fa-times"></i> </button> </div> <div class="modale__content__body"> <div class="tab mt-3" id="tab-4"> <button class="tab__item tab__item--active tabindex--share" data-index="1" tabindex="-1"> Partager l’URL </button> <button class="tab__item modal__tab tabindex--share" data-index="2" tabindex="-1"> Intégrer </button> </div> <div class="tab__values" id="tab-4-values"> <div class="share__modal__body__content tab__values__value tab__values__value--active" id="tab-4-value-1"> <div class="share__modal__body__content__url"> <input id="shareURL" type="text" value="https://books.openedition.org/cdf/529" readonly> <button class="share__modal__body__content__copy copyButton tabindex--share" data-input-target="shareURL" data-translation="Copier" tabindex="-1">Copier</button> </div> <div class="modale__networks"> <a class="footer__networks__icon x tabindex--share" target="_blank" href="https://x.com/intent/tweet?text=<span xml:lang="fr" lang="fr">Sciences des données : de la logique du premier ordre à la Toile</span>, Collège de France,Serge Abiteboul%0a@OpenEditionActu%0ahttps://books.openedition.org/cdf/529" title="X" tabindex="-1"> <i class="fab fa-x-twitter"></i> </a> <a class="footer__networks__icon facebook tabindex--share" target="_blank" href="https://www.facebook.com/sharer/sharer.php?u=https%3A%2F%2Fbooks.openedition.org%2Fcdf%2F529&src=sdkpreparse" title="Facebook" tabindex="-1"> <i class="fab fa-facebook"></i> </a> <a class="footer__networks__icon mail tabindex--share" target="_blank" href="mailto:?subject=<span xml:lang="fr" lang="fr">Sciences des données : de la logique du premier ordre à la Toile</span>&body=<span xml:lang="fr" lang="fr">Sciences des données : de la logique du premier ordre à la Toile</span>.%0D%0A%0D%0ACollège de France.%0D%0A%0D%0Ahttps://books.openedition.org/cdf/529%0D%0A%0D%0ASerge Abiteboul" title="Email" tabindex="-1"> <i class="fas fa-envelope"></i> </a> </div> </div> <div class="share__modal__body__content tab__values__value" id="tab-4-value-2"> <div class="share__modal__body__content__size"> <label class="share__modal__body__content__size__label" for"share-modal-select-size">Choisir la taille de l’intégration</label> <select class="share__modal__body__content__size__select tabindex--share" id="share-modal-select-size" tabindex="-1"> <option value="small">Petit (500x375 px)</option> <option value="medium">Moyen (800x600 px)</option> <option value="large">Grand (1024x768 px)</option> </select> </div> <div class="share__modal__body__content__html"> <label for="shareHTML">Collez le code HTML suivant pour intégrer ce contenu sur votre site.</label> <textarea id="shareHTML" data-content-url="https://books.openedition.org/cdf/529" readonly><iframe src="https://books.openedition.org/cdf/529?format=embed" style="padding:5px;border:2px solid #ddd;" height="500" width="375"></iframe></textarea> <button class="share__modal__body__content__copy copyButton w-100 tabindex--share" data-input-target="shareHTML" data-translation="Copier" tabindex="-1">Copier</button> </div> </div> </div> </div> <div class="modale__content__footer"></div> </div> </div> <div id="citedByModal" class="modale modale--hidden" aria-hidden="true"> <div class="modale__background modale__close"></div> <div class="modale__content"> <div class="modale__content__header modale__header"> <div class="modale__content__header__title"> <p class="share__modal__header__left__info__title">Sciences des données : de la logique du premier ordre à la Toile</p> </div> <button type="button" class="modale__close modale__content__header__close tabindex--citedby" aria-label="Fermer" tabindex="-1"> <i class="fas fa-times"></i> </button> </div> <div id="citedByBodyModal" class="modale__content__body"> <p class="modale__content__body__label"> Ce livre est cité par </p> <ul class="modale__content__body__list"> <li class="modale__content__body__list__item">Reymond, David. Noyer, Jean-Max. (2022) Se former aux humanités numériques par les données ouvertes : les chaînes infométriques de Patent2Net (P2N). <em>Humanités numériques</em>. DOI: <a href="https://dx.doi.org/10.4000/revuehn.3014">10.4000/revuehn.3014</a></li> </ul> <p class="modale__content__body__label"> Ce chapitre est cité par </p> <ul class="modale__content__body__list"> <li class="modale__content__body__list__item">(2016) <em> Transformation of Collective Intelligences</em>. DOI: <a href="https://dx.doi.org/10.1002/9781119370901.biblio">10.1002/9781119370901.biblio</a></li> <li class="modale__content__body__list__item">Lafioune, Nawel. St-Jacques, Michèle. (2020) Towards the creation of a searchable 3D smart city model. <em>Innovation & Management Review</em>, 17. DOI: <a href="https://dx.doi.org/10.1108/INMR-03-2019-0033">10.1108/INMR-03-2019-0033</a></li> <li class="modale__content__body__list__item">Baron, Georges-Louis. Drot-Delange, Beatrice. Grandbastien, Monique. Tort, Françoise. (2014) Computer Science Education in French Secondary Schools. <em>ACM Transactions on Computing Education</em>, 14. DOI: <a href="https://dx.doi.org/10.1145/2602486">10.1145/2602486</a></li> </ul> </div> <div class="modale__content__footer"></div> </div> </div> <div id="pdfEpubModal" class="modale modale--hidden" aria-hidden="true"> <div class="modale__background modale__close"></div> <div class="modale__content"> <div class="modale__content__header modale__header"> <div class="share__modal__header__left"> <div classs="share__modal__header__left__info"> <p class="share__modal__header__left__info__title">Sciences des données : de la logique du premier ordre à la Toile</p> </div> </div> <button type="button" class="modale__close modale__content__header__close" aria-label="Fermer" tabindex="-1"> <i class="fas fa-times"></i> </button> </div> <div class="modale__content__body modale__content__body--pdfepub"> <p class="modale__content__body--pdfepub__text"> Ce livre est diffusé en accès ouvert freemium. L’accès à la lecture en ligne est disponible. L’accès aux versions PDF et ePub est réservé aux bibliothèques l’ayant acquis. Vous pouvez vous connecter à votre bibliothèque à l’adresse suivante : <a href="https://freemium.openedition.org/oebooks">https://freemium.openedition.org/oebooks</a> </p> <div class="modale__content__body--pdfepub__buttons"> <a class="modale__content__body--pdfepub__buttons__button" href="https://www.7switch.com/fr/ebook/9782722601710/from/openedition" tabindex="-1"> Acheter ce livre aux formats PDF et ePub </a> </div> <p class="modale__content__body--pdfepub__help"> Si vous avez des questions, vous pouvez nous écrire à access[at]openedition.org </p> </div> </div> </div> <div id="citeModal" class="modale modale--hidden" aria-hidden="true"> <div class="modale__background modale__close"></div> <div class="modale__content"> <div id="citeBodyModal" class="modale__content__body modale__content__body--cite"> <div class="modale__content__body__title"> <p class="modale__content__body__title__text"> Référence numérique du chapitre </p> <button type="button" class="modale__close modale__content__header__close tabindex--cite" aria-label="Fermer" tabindex="-1"> <i class="fas fa-times"></i> </button> </div> <div class="modale__content__body__formats"> <p class="modal--biblio__top__left__title modale__content__body__formats__title"> Format </p> <div class="modal--biblio__top__left__formats"> <button class="modal--biblio__top__left__formats__item cite-format tabindex--cite " data-target="apa-1" data-order="1" tabindex="-1"> APA </button> <button class="modal--biblio__top__left__formats__item cite-format tabindex--cite " data-target="chicago-1" data-order="1" tabindex="-1"> Chicago </button> <button class="modal--biblio__top__left__formats__item cite-format tabindex--cite modal--biblio__top__left__formats__item--active " data-target="mla-1" data-order="1" tabindex="-1"> MLA </button> </div> </div> <div class="modale__content__body__texts modale__content__body__texts--chapter"> <div class="modale__content__body__texts__text " data-format="apa-1" data-order="1"> <div class="csl-bib-body"> <div class="csl-entry">Abiteboul, S. (2012). Sciences des données : de la logique du premier ordre à la Toile. In <i>Sciences des données : de la logique du premier ordre à la Toile</i> (1‑). Collège de France. https://doi.org/10.4000/books.cdf.529</div> </div> </div> <div class="modale__content__body__texts__text " data-format="chicago-1" data-order="1"> <div class="csl-bib-body"> <div class="csl-entry">Abiteboul, Serge. « Sciences des données : de la logique du premier ordre à la Toile ». In <i>Sciences des données : de la logique du premier ordre à la Toile</i>. Paris: Collège de France, 2012. https://doi.org/10.4000/books.cdf.529.</div> </div> </div> <div class="modale__content__body__texts__text active " data-format="mla-1" data-order="1"> <div class="csl-bib-body"> <div class="csl-entry">Abiteboul, Serge. « Sciences des données : de la logique du premier ordre à la Toile ». <i>Sciences des données : de la logique du premier ordre à la Toile</i>, Collège de France, 2012, https://doi.org/10.4000/books.cdf.529.</div> </div> </div> </div> <div class="modale__content__body__title"> <p class="modale__content__body__title__text"> Référence numérique du livre </p> </div> <div class="modale__content__body__formats"> <p class="modal--biblio__top__left__title modale__content__body__formats__title"> Format </p> <div class="modal--biblio__top__left__formats"> <button class="modal--biblio__top__left__formats__item cite-format tabindex--cite " data-target="apa-2" data-order="2" tabindex="-1"> APA </button> <button class="modal--biblio__top__left__formats__item cite-format tabindex--cite " data-target="chicago-2" data-order="2" tabindex="-1"> Chicago </button> <button class="modal--biblio__top__left__formats__item cite-format tabindex--cite modal--biblio__top__left__formats__item--active " data-target="mla-2" data-order="2" tabindex="-1"> MLA </button> </div> </div> <div class="modale__content__body__texts modale__content__body__texts--chapter"> <div class="modale__content__body__texts__text " data-format="apa-2" data-order="2"> <div class="csl-bib-body"> <div class="csl-entry">Abiteboul, S. (2012). <i>Sciences des données : de la logique du premier ordre à la Toile</i> (1‑). Collège de France, Fayard. https://doi.org/10.4000/books.cdf.506</div> </div> </div> <div class="modale__content__body__texts__text " data-format="chicago-2" data-order="2"> <div class="csl-bib-body"> <div class="csl-entry">Abiteboul, Serge. <i>Sciences des données : de la logique du premier ordre à la Toile</i>. Paris: Collège de France, Fayard, 2012. https://doi.org/10.4000/books.cdf.506.</div> </div> </div> <div class="modale__content__body__texts__text active " data-format="mla-2" data-order="2"> <div class="csl-bib-body"> <div class="csl-entry">Abiteboul, Serge. <i>Sciences des données : de la logique du premier ordre à la Toile</i>. Collège de France, Fayard, 2012, https://doi.org/10.4000/books.cdf.506.</div> </div> </div> </div> </div> <div class="modale__content__footer modale__content__footer--zotero"> <div class="modale__content__footer__logo"> Compatible avec Zotero <img class="modale__content__footer__logo__img" src="/assets/images/zotero-logo.svg" alt="Zotero" loading="lazy" /> </div> </div> </div> </div> <div id="lightbox" class="lightbox lightbox--hidden" aria-hidden="true" data-current-page="1" data-last-page="3" data-site="cdf" data-contentid="529" data-translations="{"download_original_picture":"T\u00e9l\u00e9charger l\u2019image","zoom_in":"Agrandir"}"> <div class="lightbox__background lightbox__close"></div> <div class="lightbox__body"> <div class="lightbox__body__header"> <p class="lightbox__body__header__page"> <span class="lightbox__body__header__page__span" id="lightbox-currentpage">1</span> / <span class="lightbox__body__header__page__span" id="lightbox-lastpage">3</span> </p> <button class="lightbox__body__header__button lightbox__close"><i class="fas fa-times"></i></button> </div> <div id="lightbox_gesture_zone" class="lightbox__body__pictures"> <div class="lightbox__body__pictures__pagination"> <button class="lightbox__body__pictures__pagination__button" data-direction="previous"> <i class="fas fa-chevron-left"></i> </button> <button class="lightbox__body__pictures__pagination__button" data-direction="next"> <i class="fas fa-chevron-right"></i> </button> </div> </div> <div id="lightbox_informations" class="lightbox__body__informations"></div> </div> </div> <script src="https://cdn.jsdelivr.net/npm/exif-js" defer></script> </article> </div> <div class="plan__directions--mobile"> <button class="plan__directions--mobile__item top" aria-label="Aller en haut de page"> <i class="fas fa-arrow-up"></i> </button> <button class="plan__directions--mobile__item bottom" aria-label="Aller en bas de page"> <i class="fas fa-arrow-down"></i> </button> </div> </main> </div> <footer class="footer--homepage"> <div class="footer--homepage__block"> <div class="footer--homepage__block__column footer--homepage__block__column--site footer-column-1"> <div class="footer--homepage__block__column__row"> <div class="footer--homepage__block__column__list"> <a class="footer--homepage__block__column__logo" href="/cdf/" title="Collège de France"> <img class="footer--homepage__block__column__logo__img" src="/cdf/file/options/15/download" alt="Collège de France" loading="lazy" /> </a> <div class="footer--homepage__block__column__list"> <p class="footer--homepage__block__column__list__title books"> Collège de France </p> <a class="footer--homepage__block__link books" href="/cdf/sitemap" title="Plan du site"> Plan du site </a> <a class="footer--homepage__block__link books" href=" /login/cdf " title="Se connecter"> Se connecter </a> </div> </div> <div class="footer--homepage__block__column__list"> <p class="footer--homepage__block__column__list__title footer--homepage__block__column__list__title--follow books"> Suivez-nous </p> <div class="footer--homepage__block__column__list__line alt"> <a class="footer__networks__icon rss" href="https://books.openedition.org/cdf/backend/?format=rss" title="Flux RSS"> <i class="fas fa-rss"></i> </a> </div> <p class="footer--homepage__block__column__list__information"> URL : <a class="footer--homepage__block__column__list__information__link" href="http://www.college-de-france.fr/site/publications/index.htm"> http://www.college-de-france.fr/site/publications/index.htm </a> </p> <p class="footer--homepage__block__column__list__information"> Email : publications@college-de-france.fr </p> <p class="footer--homepage__block__column__list__information address"> Adresse : </p> <p class="footer--homepage__block__column__list__value"> 11, place Marcelin Berthelot </p> <p class="footer--homepage__block__column__list__value"> 75231 </p> <p class="footer--homepage__block__column__list__value"> Paris </p> <p class="footer--homepage__block__column__list__value"> France </p> </div> </div> </div> <div class="footer--homepage__block__column footer--homepage__block__column--site footer-column-2"> <a class="footer--homepage__block__column__logo" href="https://openedition.org" title="OpenEdition"> <img class="footer--homepage__block__column__logo__img" src="/assets/images/oe-logo.png" alt="OpenEdition" loading="lazy" /> </a> <div class="footer--homepage__block__column__list"> <a class="footer--homepage__block__link openedition" href="https://www.openedition.org/10829" title="Candidater à OpenEdition Books"> Candidater à OpenEdition Books </a> <a class="footer--homepage__block__link openedition" href="https://www.openedition.org/14043" title="Connaître le programme OpenEdition Freemium"> Connaître le programme OpenEdition Freemium </a> <a class="footer--homepage__block__link openedition" href="https://www.openedition.org/13052" title="Commander des livres"> Commander des livres </a> <a class="footer--homepage__block__link openedition" href="https://www.openedition.org/41045" title="S’abonner à la lettre d’OpenEdition"> S’abonner à la lettre d’OpenEdition </a> <a class="footer--homepage__block__link openedition" href="/gtcu" title="CGU d’OpenEdition Books"> CGU d’OpenEdition Books </a> </div> </div> </div> <div class="footer--homepage__block line"> <a class="footer--homepage__block__link books" href="/accessibility" title="Accessibilité : non conforme"> Accessibilité : non conforme </a> <a class="footer--homepage__block__link books" href="https://www.openedition.org/19362" title="Données personnelles"> Données personnelles </a> <a class="footer--homepage__block__link books" href="https://www.openedition.org/37235" title="Gestion des cookies"> Gestion des cookies </a> <a class="footer--homepage__block__link books" href="https://www.openedition.org/41101" title="Système de signalement"> Système de signalement </a> </div> </footer> </div> <script src="/assets/front/js/front.0367253e.js" defer></script> <script src="/tarteaucitronjs/tarteaucitron.js"></script> <script type="text/javascript"> tarteaucitron.init({ "privacyUrl" : "https://www.openedition.org/19362", /* Privacy policy url */ "hashtag" : "#tarteaucitron", /* Open the panel with this hashtag */ "cookieName" : "tarteaucitron", /* Cookie name */ "orientation" : "popup", /* Banner position (top - bottom) */ "groupServices" : false, /* Group services by category */ "showAlertSmall" : false, /* Show the small banner on bottom right */ "cookieslist" : false, /* Show the cookie list */ "closePopup" : false, /* Show a close X on the banner */ "showIcon" : true, /* Show cookie icon to manage cookies */ "iconSrc" : "data:image/png;base64, iVBORw0KGgoAAAANSUhEUgAAADAAAAAwCAYAAABXAvmHAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAAOxAAADsQBlSsOGwAABWNJREFUaIHtmF1sk1UYx3+ndKNv2ZgdZOIwLCZkFaNMEiAZDBDBGxkgW0IiN5iImnjFvFEjYCATwwWBKy4AE3eDhoQirFw5A8OOJUCCRGLsJDEbMMkCW8Zqu7Hufbx4S7u271dHUS/6T5Y173nOef7nPF/nPFBCCSWU8F9CPWsFv35Kg3cWLQrWAEGBeSnFD4Gogp8fTxF67RA3Z7L+M9tA9AvW6kI70KSUvR4RRCkius7eV76muxA9Rd/AlTa0gI+jKHYphaegyYIuwsmRcXavOkLCzZSibuBWG9VejTCKxixeklKWoy18w08kqtEUTNC8LD5tAr3JBM2vHmHYSWdhJ2SDgTY0r0ZnLvlbd8s5cLaaA2eruXW3PMNRoKdPI6krrvRp6DJtkqLRqxG+0ob2r23gb8NtVuV+P3O1grFxD2PjHs5crciyxur6BF6PsKo+gSfXFxSNAR9HnfQWxYVSAXvJLFj3h6oZGzfOqdKns2/bcNqVZNqp57qXIYCuC2/aBXZRLCBCu1WmaV0Zo9KnU+nTaV0ZyyKqVObPFAqPUrTb6X5qC/z+OUtF8YtdqrQKYjcQQTxTLAta1ImntoAoWp3yvNkph2/4+ez7eYRv+LNcyWSu0j20Wo17C6ObgZxjKdA6McH7s2aBJ7WSnoTHCYiPQWwYJuLm8yNRIwNF+jQ2vW4hlNlEU9E2IGHWohsVFoWanZPoPOXgLQd/FcxbCIkxeHDH+D8dTcEEkT6NpnpX9SpoNeDaK+U0GkZa+wAHl8mbKzA6BEP9IHrmW5qEw2oiTCw5iM9szJUF5DTV+Og0y/PToevgMYkqpeC552G2H+5GDTczIz2TYHcMYjmNhnE9sCUf6qqh7VCQ0I81ljJaJbwYBGWiVQSOdVVxrKsqL6hTN1dTOGchw20ancQuXg3weNLDxWsB26yiVUJNnaPWXEStBmxdSMKsRdjlRsP6FSN0Xw+wbvmIo2xVDTx6kB3YSsHHG0fTv7N4CBGrtezv6ee5jGKNI6OMItf+G38Ed35ztebMCpl00gDW+dcMhQSfVmkEtQv0WJEH+xhocZMuRYzsY+f3up7/TSmoqHZcWxdhj52MdQwIa5zoPxgpo+NcLf2DPupqx9m5dZD5gcksmVBXDd3XjNhoeWsoa8xfaZNeAKU4ueSg/RPT2gLKuvo9Qce5Wm4P+JlMerg94OfbH2rzZC7ZZKdyu+eK0DscZ7cTB+sNiNE9mI5cV/jzXnZx7B/05ZF8Y+UI5WU661fkZyePhf0l9aR08y52fRcyc4WXFo5zeyATiXW143mB3LJxiG0bhlwFeKo7cWJOgt2LXD7q7Vwo7Z4i0H3NcIXu64G0JXZuHWTxojhlXp3Fi+K8986g+VIW5PVkhrgIERHWv/wVH7klD/ZBHEVR+4TAuuUjXEpZ4Ml9Z35gkk929qfz/3Sibu41U1PcU8I3k8+isSWd7Af2ZX1zWahuRiv47sICAN7ddJ+GYMxK9IDazJduyZrBrg6EELJC0m2hOhV+gdFYGaOxMk5dWGBeI4y1Q66ZWsByA2ozN8H6DgKGRewKmC0UPSkdTwWn2+hewKSOGjjcUcfhjrq8Texo/ou5c5LMnZNkx9v38y0nCA4V1i1s06jaQrec5ySKD00FLE6/IRhjaf0fxhrmbndCbSmsiWvJ0Ukg9aD5CZM3wQzbJb0k2KC2u0+VdnB80KjtJEjQDPTmjdk1pczRS4LmYpEHl30htZ1hEmxAOI5NTNhARzieOnnHjnMhKLhXJudZh9COYrXjddsI1h4Ue4rl87mYcWtROmlAaMXoDwXTlz/FQ4QoEEFxphipsoQSSijh/4t/AMYg8B9hSd4ZAAAAAElFTkSuQmCC", /* Optionnal: URL or base64 encoded image */ "iconPosition" : "BottomLeft", /* BottomRight, BottomLeft, TopRight and TopLeft */ "adblocker" : false, /* Show a Warning if an adblocker is detected */ "DenyAllCta" : true, /* Show the deny all button */ "AcceptAllCta" : true, /* Show the accept all button when highPrivacy on */ "highPrivacy" : true, /* HIGHLY RECOMMANDED Disable auto consent */ "handleBrowserDNTRequest" : false, /* If Do Not Track == 1, disallow all */ "removeCredit" : false, /* Remove credit link */ "moreInfoLink" : true, /* Show more info link */ "useExternalCss" : false, /* If false, the tarteaucitron.css file will be loaded */ "useExternalJs" : false, /* If false, the tarteaucitron.js file will be loaded */ "readmoreLink" : "https://www.openedition.org/37235", /* Change the default readmore link */ "mandatory" : true, /* Show a message about mandatory cookies */ }); (tarteaucitron.job = tarteaucitron.job || []).push("archive"); (tarteaucitron.job = tarteaucitron.job || []).push("youtube"); (tarteaucitron.job = tarteaucitron.job || []).push("dailymotion"); (tarteaucitron.job = tarteaucitron.job || []).push("vimeo"); </script> <script type="text/javascript" defer> var _paq = _paq || []; // tracker methods like "setCustomDimension" should be called before "trackPageView" _paq.push(['setCustomVariable', 1, 'Domain', document.domain, 'visit']); _paq.push(['setCustomVariable', 2, 'Site', 'cdf', 'visit']); _paq.push(["setDocumentTitle", 'cdf' + " | " + document.title]); _paq.push(['enableCrossDomainLinking']); _paq.push(['setDownloadExtensions', "pdf|epub"]); _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u='https://analytics.openedition.org'; _paq.push(['setTrackerUrl', u+'/matomo.php']); _paq.push(['setSiteId', '29']); var secondaryTrackerUrl = 'https://pk.labocleo.org' + '/matomo.php'; var secondaryWebsiteId = '5'; _paq.push(['addTracker', secondaryTrackerUrl, secondaryWebsiteId]); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.type='text/javascript'; g.async=true; g.defer=true; g.src=u+'/matomo.js'; s.parentNode.insertBefore(g,s); })(); </script> </body> </html>