<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Articles on Data Diffusion</title>
    <link>https://localhost:1313/articles/</link>
    <description>Recent content in Articles on Data Diffusion</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>fr</language>
    <copyright>© 2026 Christophe Goudet, PhD</copyright>
    <lastBuildDate>Wed, 04 Mar 2026 08:00:00 +0200</lastBuildDate><atom:link href="https://localhost:1313/articles/index.xml" rel="self" type="application/rss+xml" />
    
    <item>
      <title>Serveur MCP de data.gouv : ce qui change pour l’accès aux données publiques, et ce qui reste à faire</title>
      <link>https://localhost:1313/articles/mcp_data_gouv/</link>
      <pubDate>Wed, 04 Mar 2026 08:00:00 +0200</pubDate>
      
      <guid>https://localhost:1313/articles/mcp_data_gouv/</guid>
      <description>&lt;h2 class=&#34;relative group&#34;&gt;data.gouv.fr et MCP : de quoi parle-t-on ?&#xA;    &lt;div id=&#34;datagouvfr-et-mcp--de-quoi-parle-t-on-&#34; class=&#34;anchor&#34;&gt;&lt;/div&gt;&#xA;    &#xA;    &lt;span&#xA;        class=&#34;absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none&#34;&gt;&#xA;        &lt;a class=&#34;text-primary-300 dark:text-neutral-700 !no-underline&#34; href=&#34;#datagouvfr-et-mcp--de-quoi-parle-t-on-&#34; aria-label=&#34;Ancre&#34;&gt;#&lt;/a&gt;&#xA;    &lt;/span&gt;&#xA;    &#xA;&lt;/h2&gt;&#xA;&lt;p&gt;&lt;a href=&#34;https://www.data.gouv.fr/&#34;  target=&#34;_blank&#34; rel=&#34;noreferrer&#34;&gt;data.gouv.fr&lt;/a&gt; est la plateforme française des données publiques ouvertes.&#xA;Elle centralise des milliers de jeux de données (statistiques, environnement, transport, économie, etc.) et permet de les rechercher, télécharger et réutiliser.&#xA;Jusqu&amp;rsquo;ici, exploiter ces données supposait de naviguer sur le site, de formuler une recherche, de parcourir les résultats puis de télécharger et traiter les fichiers localement.&lt;/p&gt;</description>
      <media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://localhost:1313/articles/mcp_data_gouv/featured.png" />
    </item>
    
    <item>
      <title>Les fonctions de hash pour simplifier la création d&#39;historiques</title>
      <link>https://localhost:1313/articles/unicity_sha/</link>
      <pubDate>Tue, 16 Dec 2025 08:24:53 +0200</pubDate>
      
      <guid>https://localhost:1313/articles/unicity_sha/</guid>
      <description>&lt;p&gt;En tant que data engineer, nous ne sommes pas toujours maîtres de nos données sources.&#xA;En particulier lorsque l&amp;rsquo;on utilise des données ouvertes, nous sommes à la merci des changements des producteurs de données.&lt;/p&gt;</description>
      <media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://localhost:1313/articles/unicity_sha/featured.png" />
    </item>
    
    <item>
      <title>Déduplication de données : utilisation de la résolution d&#39;entités sur la base Transparence Santé</title>
      <link>https://localhost:1313/articles/entity_resolution/</link>
      <pubDate>Tue, 14 Oct 2025 10:00:00 +0200</pubDate>
      
      <guid>https://localhost:1313/articles/entity_resolution/</guid>
      <description>&lt;h2 class=&#34;relative group&#34;&gt;Le défi de l&amp;rsquo;identification des bénéficiaires&#xA;    &lt;div id=&#34;le-défi-de-lidentification-des-bénéficiaires&#34; class=&#34;anchor&#34;&gt;&lt;/div&gt;&#xA;    &#xA;    &lt;span&#xA;        class=&#34;absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none&#34;&gt;&#xA;        &lt;a class=&#34;text-primary-300 dark:text-neutral-700 !no-underline&#34; href=&#34;#le-d%c3%a9fi-de-lidentification-des-b%c3%a9n%c3%a9ficiaires&#34; aria-label=&#34;Ancre&#34;&gt;#&lt;/a&gt;&#xA;    &lt;/span&gt;&#xA;    &#xA;&lt;/h2&gt;&#xA;&lt;p&gt;L&amp;rsquo;écosystème de la santé rassemble plusieurs types d&amp;rsquo;acteurs : laboratoires pharmaceutiques, professionnels de santé et associations de patients.&#xA;Ces acteurs entretiennent entre eux des relations financières et d&amp;rsquo;influence qui peuvent créer des conflits d&amp;rsquo;intérêt.&lt;/p&gt;</description>
      <media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://localhost:1313/articles/entity_resolution/featured.png" />
    </item>
    
    <item>
      <title>Application du fuzzy matching pour la désambiguïsation de professionnels de santé</title>
      <link>https://localhost:1313/articles/clean_rpps_fuzzy/</link>
      <pubDate>Mon, 18 Aug 2025 08:00:00 +0200</pubDate>
      
      <guid>https://localhost:1313/articles/clean_rpps_fuzzy/</guid>
      <description>&lt;p&gt;La qualité des données est un enjeu central dans l&amp;rsquo;exploitation des bases de données publiques.&#xA;Dans le cadre du projet &lt;a href=&#34;https://www.eurosfordocs.fr/&#34;  target=&#34;_blank&#34; rel=&#34;noreferrer&#34;&gt;EurosForDocs&lt;/a&gt;, qui vise à apporter de la transparence sur les liens financiers entre entreprises du médicament et professionnels de santé, cet enjeu est particulièrement critique.&#xA;La fiabilité des analyses repose sur notre capacité à identifier sans ambiguïté chaque professionnel de santé recevant une rémunération ou un avantage.&lt;/p&gt;</description>
      <media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://localhost:1313/articles/clean_rpps_fuzzy/featured.jpg" />
    </item>
    
    <item>
      <title>Automatiser la composition de menus : un cas pratique d&#39;optimisation sous contraintes</title>
      <link>https://localhost:1313/articles/optimize_menus/</link>
      <pubDate>Mon, 28 Jul 2025 08:24:53 +0200</pubDate>
      
      <guid>https://localhost:1313/articles/optimize_menus/</guid>
      <description>&lt;p&gt;La restauration des employés constitue un défi logistique et RH pour les entreprises opérant 24h/24.&#xA;Alors que les supermarchés, restaurants et boulangeries sont accessibles en journée, les options se raréfient la nuit pour des professions comme les contrôleurs aériens ou les employés d&amp;rsquo;hôtels.&#xA;Une solution en plein essor est la mise à disposition de &lt;strong&gt;frigos connectés&lt;/strong&gt;.&#xA;Situés au sein de l&amp;rsquo;entreprise, ils sont régulièrement approvisionnés en produits variés (entrées, plats, desserts, boissons) pour permettre aux employés de se restaurer à toute heure.&lt;/p&gt;</description>
      <media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://localhost:1313/articles/optimize_menus/featured.jpg" />
    </item>
    
    <item>
      <title>Optimisation de jointures géospatiales : le partitionnement pour éliminer les calculs inutiles</title>
      <link>https://localhost:1313/articles/finding_neighors/</link>
      <pubDate>Tue, 01 Jul 2025 10:00:00 +0200</pubDate>
      
      <guid>https://localhost:1313/articles/finding_neighors/</guid>
      <description>&lt;p&gt;Imaginons que je sois un consultant souhaitant faire une analyse de marché de la restauration à emporter.&#xA;Je souhaite connaître pour chaque restaurant le nombre de concurrents dans un rayon de 2km.&#xA;Je peux par exemple avoir accès à des données similaires à ce &lt;a href=&#34;https://www.kaggle.com/datasets/ahmedshahriarsakib/uber-eats-usa-restaurants-menus?select=restaurants.csv&#34;  target=&#34;_blank&#34; rel=&#34;noreferrer&#34;&gt;dataset Kaggle&lt;/a&gt;, qui nous permet d&amp;rsquo;avoir accès à plus de 60k restaurants présents sur UberEats dans tous les États-Unis.&#xA;En particulier, nous avons notamment accès aux coordonnées GPS de chaque restaurant.&#xA;Cette donnée va nous permettre de calculer la distance entre deux restaurants, et donc savoir s&amp;rsquo;ils sont potentiellement concurrents.&#xA;&lt;figure&gt;&lt;img&#xA;    class=&#34;my-0 rounded-md&#34;&#xA;    loading=&#34;lazy&#34;&#xA;    decoding=&#34;async&#34;&#xA;    fetchpriority=&#34;auto&#34;&#xA;    alt=&#34;&#34;&#xA;    width=&#34;1279&#34;&#xA;    height=&#34;801&#34;&#xA;    src=&#34;https://localhost:1313/finding_neighbors/restaurants_hu8229787639644949750.png&#34;&#xA;    srcset=&#34;https://localhost:1313/finding_neighbors/restaurants_hu8229787639644949750.png 800w, https://localhost:1313/finding_neighbors/restaurants.png 1280w&#34;&#xA;    sizes=&#34;(min-width: 768px) 50vw, 65vw&#34;&#xA;    data-zoom-src=&#34;https://localhost:1313/finding_neighbors/restaurants.png&#34;&gt;&lt;/figure&gt;&#xA;&lt;/p&gt;</description>
      <media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://localhost:1313/articles/finding_neighors/featured.jpg" />
    </item>
    
  </channel>
</rss>
