Un moteur de recherche, "search engine" en anglais, est un outil qui vous permet de rechercher sur le web à l'aide de mots clefs.
L'outil aura auparavant indexé une multitude de sites à travers la toile afin de vous afficher les résultats les plus appropriés sous forme d'une page avec des liens hypertextes, ainsi qu'une description sommaire de leur contenu.
Le moteur de recherche le plus connu est, bien entendu, "Google Search" et à lui seul détient plus de 90% du marché mondial. Si bien que les propriétaires de sites internet sont en quelque sorte obligés de se plier aux règles d'indexation du géant des GAFAM pour avoir une visibilité sur la toile mondiale. Certains n'hésitent pas à payer en échange, ce qui est évidemment l'un des buts de Google Ads, Trends et compagnie.
Analyses
Blâme comportement
Le moteur de recherche de Google stocke entre autres les données suivantes :
- votre adresse IP
- votre emplacement
- votre système d'exploitation, navigateur et sa version (via le user-agent)
- vos cookies et identifiants uniques
- les termes / mots que vous saisissez en temps réel
Il est également à préciser qu'il ne s'agit pas du seul moteur de recherche qui conserve ces données : Bing (Microsoft), Yahoo Search, Baidu, Yandex également sont concernés.
Alors évidemment, nous n'irons pas plus loin et ne citerons pas les moteurs en lien direct avec des multinationales connues pour collecter toutes sortes de données privées, ou des pays pratiquant une quelconque censure nationale assumée, comme :
- Google Search
- Microsoft Bing
- Yahoo Search
- Ask . com
- Baidu
- Yandex
Inutile de dire que nous ne recommandons absolument pas ces moteurs de recherche.
Nous allons plutôt analyser les alternatives crédibles (enfin présentées comme telles) à tous ces moteurs anti-vie privée ...
Avertissements
DuckDuckGo
DuckDuckGo est très certainement le moteur de recherche alternatif le plus connu et finalement le plus controversé. Il croise différentes sources pour donner des résultats pertinents. Il utilise l'indexation de Bing (Microsoft) et a été justement pendant un temps sujet de controverses pour ses liens avec Microsoft (confirmé ici) qui a fait scandale dans la communauté.
DDG a réussi une parfaite illusion... Le moteur est adopté par une grande partie du public, y compris sur Tor Browser. Et pourtant les signaux sont présents :
- Le créateur a déjà vendu les données d'utilisateurs de son ancien réseau social "Names Database"
Bien que leur politique de vie privée annonce qu'ils ne "stockent aucune information personnelle", ce n'est pas le cas des recherches elles-mêmes, procédé qui par le passé avait déjà fait beaucoup de dégâts, comme rappelé ici :
"Le problème le plus sérieux est que beaucoup de personnes recherchent leurs propres nom/prénom, ou ceux de leurs amis ou entourages, afin de vérifier quelles informations sont disponibles sur eux ou leurs proches sur internet. Combinez cela avec des requêtes de site pour adultes et vous créez un embarras assez sérieux. Combinez cela avec une recherche comme "acheter du cannabis" et vous obtenez une preuve criminelle dans certains pays. Combinez cela avec une adresse postale, un numéro de sécurité sociale, etc. et vous avez un vol d'identité probablement qui arrivera un jour. Les possibilités sont infinies."
Et surtout avec les moyens actuels !
Non seulement DDG stockent vos requêtes, mais celles-ci s'accompagnent d'autres informations d'intérêts pour eux, même s'ils prétendent anonymiser ces informations. Un article écrit par DDG ne disait-il pas : "The only truly anonymized data is no data**", ce qui peut se traduire ainsi : "Les seules données véritablement anonymes sont celles qui n'existent pas" !
Visiblement, ils n'appliquent pas leurs propres conseils.
Très récemment (Mars 2022), DDG a annoncé appliquer une censure sur les résultats des recherches. On est loin d'un modèle tout à fait sain.
Qwant
Qwant est un moteur de recherche Français, à l'origine projet aux intentions plus que louables : renforcer la vie privée de ses utilisateurs lors des recherches web. Néanmoins, il apparaît que celui-ci n'a pas tout à fait tenu ses promesses 7, 8, 9, 10 et 11. Côté technique, il reprend donc les résultats de recherche de Bing (Microsoft), et coopère également avec ces derniers pour l'affichage de publicités.
Avons-nous besoin réellement d'aller plus loin ? Tentons-un coup d’œil à leur politique de vie privée :
"Qwant stocke pour 7 jours les mots-clés entrés associés à un unique identifiant calculé sur le User Agent de votre navigateur et une empreinte salée (salted hash) de votre adresse IP. Après cette période, les mots clés ne sont plus associés à cet identifiant et sont stockés pour 12 mois à des fins d'analyses statistiques.". Plus loin : "Qwant peut aussi collecter et transférer à son partenaire [Microsoft] votre adresse IP complète. Cette donnée est transférée à ce partenaire dans l'Union Européenne et peut être stockée ... pour un maximum de 18 mois."
Nous pouvons nous arrêter là.
Mention médiocre
Les autres "experts de la vie privée" ⚠️ Ceci est volontairement ironique ⚠️
Swisscows
Swisscows possède ses serveurs en Suisse. Ils proposent un service "anonyme" via leur propre index, et ne "stockent aucune donnée personnelle de ses utilisateurs". Il intègre également des filtres de contenus sensibles.
A première vue, ce moteur semble partir sur de bons rails. Regardons maintenant leur politique de vie privée de plus près :
Nous sommes dubitatifs quant à l'information concernant leur propre index de recherche, en effet :
"Nous travaillons actuellement avec Bing et nous sommes très transparents à propos de cette coopération."
Donc à priori ils travaillent avec Microsoft, même si visiblement ils ne partageraient pas d'information avec eux...
La fonction de filtres de contenus sensibles implique qu'ils vérifient tout de même les requêtes transmises (notamment leur contenu) :
"Nous collectons les données des requêtes de recherches pour être capable de filtrer les spams et les recherches abusives. Malheureusement, nous sommes obligés de surveiller et bloquer les robots spam, sinon le traitement de ces demandes nous coûterait de l'argent et des ressources."
Bon, cela part d'une bonne intention, mais vous auriez pu le dire explicitement dès le début que vous surveilliez les requêtes !
Ensuite, nous voyons cette phrase aux lourdes conséquences :
"Après 7 jours, nous supprimons toutes vos informations personnelles (comme votre adresse IP et le user agent) des données de recherche."
Ah, donc finalement vous collectez des données très personnelles ?
- On termine sur le fait que le moteur ne fonctionne absolument pas sans Javascript. Pour un moteur clamant l'anonymat des requêtes, on a vu mieux.
Ecosia
Ecosia se décrit comme le moteur de recherche "qui plante des arbres". Base son index sur les résultats Bing et assure ne pas se soucier de vos données mais plutôt des arbres !
En regardant de plus près leur politique de vie privée, nous nous rendons compte que le moteur n'est pas si privé que cela par défaut :
"Afin de fournir des services essentiels tels que les paramètres de langue et la protection contre le spam (voir ci-dessous), nous collectons votre adresse IP pendant sept jours maximum avant de la supprimer."
ou encore :
"Nous ne recueillons qu'une quantité limitée de données pour améliorer nos services. Si vous ne souhaitez pas nous donner accès à ces données, vous êtes libre d'activer « Do Not Track » à partir des paramètres de votre navigateur.".
Puis nous lisons que :
"Ecosia utilise les cookies pour enregistrer vos paramètres, notamment pour savoir quelle langue d’affichage privilégier. [...]".
Inutile d'aller plus loin, sachant également qu'ils ont récemment opter pour intégrer Cloudflare dans leur infrastructure.
Discrete Search
Lilo
Ce moteur n'est pas open-source, c'est déjà un gros point négatif pour nous, selon nos exigences ! Mais ce moteur visiblement est solidaire et éthique, ça a l'air vraiment pas mal...
Tentons un rapide coup d'oeil à leur politique de vie privée (notamment la section "Lorsque vous utilisez Lilo Moteur de Recherche") :
"Lorsque vous effectuez une recherche sur Lilo, nous sommes amenés à traiter différentes informations pour afficher les réponses à vos recherches de manière pertinente, lutter contre la Fraude, respecter nos obligations légales et vous attribuer les précieuses gouttes d’eau associées à vos recherches 😊
Il s’agit des informations suivantes : le navigateur que vous utilisez (le User Agent) ; vos préférences de session (afficher les résultats en français par exemple) ; votre adresse IP ; la zone géographique approximative à l’origine de la recherche (déduite de l’adresse IP) ; et éventuellement des données sur votre comportement de navigation, comme le temps écoulé entre 2 clics par exemple (toujours dans l’objectif de vérifier que l’utilisateur n’est pas un robot qui clique à la vitesse de la lumière 😉).
Afin de vous fournir des résultats pertinents et de générer du revenu que nous pourrons transformer en argent pour financer les gouttes d’eau, nous avons un partenariat avec Microsoft Bing (qui respecte le Règlement Général sur la Protection des Données) pour la fourniture des résultats de recherche et des publicités. C’est pourquoi Lilo peut être amené à transmettre ces mêmes données à ce partenaire. Dans ce cas, conformément à sa politique de confidentialité, ce partenaire peut être amené à conserver ces données sur une période maximum de 18 mois."
Mention passable
Brave Search
Brave search est le moteur de recherche de la société Brave Inc., moteur "respectueux de la vie privée" d'après leur cahier des charges. Il implémente son propre moteur d'indexation (au contraire de Duckduckgo), et dorénavant est complètement indépendant d'autres moteurs (i.e. Google et Bing). Également, récemment Brave Search a annoncé mettre à jour leur modèle de financement vers de la publicité choisie qui se présente sous la forme d'une option activable.
Après avoir exposé l'enveloppe, voyons ce qu'elle contient :
- Lorsque nous regardons leur politique de vie privée, nous lisons ceci :
"Vous pouvez rechercher 'bar autour de moi' Brave Search utilisera l'adresse IP transmise par votre équipement mais sans la partager ni la stocker. Cela signifie que nous ne pouvons pas rapprocher votre recherche à vous même ou à votre localisation."
Rien de plus n'est dit sur une quelconque collecte de données...
- ...Super ! Sauf qu'une page bien particulière, nommée 'usage metrics' est présente et fait état de ceci :
[Le moteur] "est relativement nouveau et à ce titre nous sommes encore en train d'apprendre comment les personnes interagissent avec le site, ainsi que les performances. Spécifiquement, nous espérons apprendre les éléments suivants : - Nombre de visites quotidiennes / hebdomadaires / mensuelles - Nombre de visites récurrentes - Nombre de requêtes par jour - Combien de temps vous utilisez Brave Search - Moyenne de la taille de vos requêtes - Combien d'utilisateurs choisissent de laisser un commentaire sur Brave Search - Le système d'exploitation que les utilisateurs utilisent (par ex. : macOS, Windows, etc.) - Le navigateur que vous utilisez (par ex. : Brave, Chrome, Safari, etc) - Les clics et les vues sur les publicités qui apparaissent sur Brave Search - Le pays associé aux clics et vues".
C'est tout de même une liste conséquente. La jeunesse n'excuse pas tout ! Même si techniquement, l'implémentation de la collecte de ces données limite le profilage...
- En revanche pour effectuer des recherches sur Brave Search via Tor, il est maintenant nécessaire d'activer le Javascript et WebAssembly, ce qui augmente le risque de désanonymisation. De toute manière, nous ne recommanderons jamais d'utiliser Tor en dehors de Tor Browser.
StartPage
StartPage est un moteur de recherche fondé sur la "protection stricte de la vie privée"" car d'après eux "La vie privée est un droit fondamental de l'être humain" ! Il emprunte les résultats du moteur de recherche Google, que StartPage indexe, et font comme Lilo en coupant le pistage publicitaire ciblé, semble-t-il. Cependant, certains utilisateurs de Tor et/ou de VPN peuvent rencontrer des difficultés, car StartPage bloque certaines adresses IP de serveurs connus.
Alors, ce navigateur serait-il l'heureux élu ? Tentons de creuser un peu plus dans leur politique de vie privée :
"Nous n'enregistrons pas votre adresse IP"
Une intention très louable.
"Nous ne servons aucun cookie de suivi ou d'identification"
Alors tout va bien.
"Nous mesurons le trafic global et d'autres statistiques - strictement anonymes. Ces statistiques peuvent inclure le nombre de fois où notre service est accédé par un certain système d'exploitation, un type de navigateur, une langue, etc., mais nous ne savons rien des utilisateurs individuels."
Ouch... syndrôme Duckduckgo ?
"Afin de permettre la prévention de la fraude par clic, certaines informations système non nominatives sont partagées [...]"
Re-ouch... Nous allons devoir faire confiance à StartPage sur le côté "informations non nominatives" car ils ne disent pas du tout en quoi ces données consistent !
Pour terminer, StartPage a récemment été racheté par une société de publicité, System1. Même s'ils assurent ne pas changer de politique, il va falloir leur faire confiance encore sur ce point, à l'heure où la confiance est rompue, cela fait un peu beaucoup. Bon après, tout n'est pas si terrible, pour le moment, bien que les résultats soient réellement mauvais, probablement parce que Google applique une censure massive.
À part cela, StartPage marche parfaitement sans Javascript, et fournit une fonction "mode anonyme" qui vous permettra de visiter des sites sans révéler votre "identité".
MetaGer
Metager est un méta-moteur de recherche (agrégation de plusieurs sources) avec accent sur la recherche "anonyme", notamment via un proxy. Il s'agit d'une organisation à but non lucratif, qui utilise "l'énergie verte" pour leurs serveurs. Attention, car les résultats sont donnés sans filtre ni classement par clic, et peuvent parfois paraître inconsistants.
Rentrons dans le vif du sujet :
- Ceci :
"Pour protéger notre service de la congestion, nous devons limiter le nombre de requêtes de recherche par connexion Internet. Dans ce seul but, nous stockons l'adresse IP complète et un horodatage pour un maximum de 96 heures."
- Et ceci :
"Pour recevoir cette publicité, nous transmettons à nos partenaires publicitaires les deux premiers blocs de l'adresse IP ainsi que certaines parties non identifiables du user agent."
- Ou ceci :
"Lors de la visite des sites web du domaine "suma-ev.de" *, les données suivantes sont collectées et stockées pendant une semaine au maximum : Votre adresse IP, Nom et URL du fichier récupéré, Date et heure de l'accès..."
* : SUMA-EV est l'association derrière Metager
Ne nous plaisent guère en terme de vie privée ! Néanmoins, ils sont clairs et concis sur leurs pratiques et n'annoncent pas clairement qu'ils ne récoltent pas de données personnelles sur leur page d'accueil, donc nous savons à quoi nous en tenir.
▶️ Attention : en 2025, MetaGer a fait évoluer son produit et ne propose son moteur que via une clé et un paiement, à la manière de Kagi.
Mention Bien
Oui bon alors, vous allez me dire : "en fait, tous les moteurs de recherche sont des vendus !". En effet, la grande majorité des moteurs n'ont au final que faire de votre vie privée, ce qui restreint réellement les choix... Mais heureusement, quelques moteurs ou méta-moteurs peuvent être dignes de confiance, pour le moment :
Gibiru
Gibiru "Unfiltered Private search" ou recherche privée non filtrée en français. Il interroge directement l'index Google, sans filtre, mais agit comme un proxy en utilisant leur propre VPN, ceci afin de ne rien partager sur l'utilisateur avec Google. Ces requêtes et les informations personnelles qui y seraient associées ne sont visiblement d'ailleurs pas stockées sur les serveurs de Gibiru à en croire leur politique de vie privée.
Le "trublion" - Mojeek
Mojeek est un méta-moteur de recherche basé au Royaume-Uni. Il possède son propre index. Il s'agit pour l'instant du moteur le plus respectueux de votre vie privée.
Malheureusement, ce moteur n'est pas open-source et ne compte pas le devenir dans un avenir proche. Mais ce ne serait pas immuable d'après leur équipe :
"Nous n'avons en effet pas ouvert Mojeek. Il est très difficile pour un moteur de recherche de l'être complètement du fait du référencement ; en effet, un moteur ouvert offrirait plus de chance à la manipulation d'acteurs cherchant à jouer le classement dans les résultats. Cela dit, nous apprécions grandement les initiatives à sources ouvertes, comme cURL et Linux, et en tirons profit. Nous n'excluons donc pas la possibilité d'ouvrir certains de nos codes source à l'avenir, si nous y voyons un avantage. Le facteur déterminant ici est qu'une telle initiative profite à la fois aux utilisateurs et à l'entreprise." Mojeek Devs.
SearX(NG)
SearX est un moteur de recherche libre, qui agrège les index de plusieurs moteurs. Il marche par instance, et peut donc être auto-hébergé par vos propres soins ou, si vous ne le sentez pas, l'accès à des instances hébergés par des tiers ou des entités particulières vous est accordé. Fonctionne parfaitement sans Javascript. La version NG améliore la gestion des images.
Vous trouverez sur cette page toutes les instances SearX. Attention cependant, elles sont tenues par des particuliers, des fondations, des entreprises. Vous ne savez pas forcément ce qu'ils font de vos informations personnelles !
Si vous en avez les compétences, vous pouvez héberger une instance vous-même.
▶️ Attention toutefois car les résultats de recherche ne sont clairement pas au niveau et en gêneront plus d'un.
Whoogle
Whoogle Search est un méta moteur de recherche qui indexe en priorité les résultats de Google, le côté tracking en moins. C'est un moteur qui, à l'instar de SearX, fonctionne par instance (vous pouvez d'ailleurs en déployer une vous-même plus ou moins facilement !).
▶️ Il n'y a plus d'instance public à l'heure où nous écrivons ces lignes, il faudra donc en passer par de l'auto hébergement si vous souhaitez utiliser ce moteur.
Pour conclure
Nous avons tenté d'être le plus transparent possible, et de limiter le choix aux meilleures options afin que vous puissiez prendre les meilleures décisions. Pour synthétiser, nous allons classer les moteurs que nous recommandons par ordre de performance et de consistance dans les recherches. Notre protocole de tests est très simple, faire une recherche avec ces mots clés :
- anonymat et tor
- wikilibriste
- quel âge a Richard stallman
- histoire de napoléon
Avec comme point de départ les résultats proposés par google.fr. L'objectif est de vérifier si les index des moteurs arrivent à avoir un niveau acceptable.
1- Gibiru
Gibiru est à notre sens l'alternative la plus crédible à nos yeux, qui coche presque toutes les cases de nos exigences, notamment pour les résultats de l'indexation Google. Les résultats sont bons, même si imparfaits. Néanmoins, le projet reste un des plus intéressants au niveau éthique.

Résultats








1bis- Brave Search
Brave Search semble plus mature aujourd'hui, l'index est performant, les résultats sont donc proches des meilleurs moteurs de recherche. Reste toujours ce côté controversé de Brave Inc. et l'importance de configurer le moteur comme suit :

- En décochant l'IA
- En décochant l'envoi de statistiques (même si anonymes)

Résultats








2- Startpage
Concernant StartPage, c'est à vous de décider si vous leur faites confiance, de notre côté ce sera non (lui préférant un modèle comme Gibiru par exemple). Mais nous sommes conscients que les résultats des recherche sont clairement à la hauteur, comme vous pouvez le voir dans les résultats ci-après.

Résultats








3- Mojeek
Mojeek est un moteur pour toute personne ayant un intérêt pour leur vie privée, mais ne soyez pas trop regardant sur les résultats et sur le code source propriétaire.
Résultats








Quid de SearXNG ?
C'est malheureusement la douche froide pour SearXNG, qui aurait pu être la meilleure alternative. Oui mais voilà, aucune instance n'arrive à égaler les meilleurs moteurs dans les résultats de recherche. Les résultats sont clairement en retrait, à la limite de la catastrophe, et il faut passer un peu de temps pour trouver les résultats qui nous conviennent.
Il n'y a à ce jour qu'une seule instance qui à nos yeux peut sortir des résultats intéressants sans être exceptionnels :
- 🇨🇭 L'instance suisse Inetol

Résultats








Les autres index
Enfin, pour ceux désirant creuser le sujet des index des moteurs de recherche, voici un billet de blog complet :
▶️ Les moteurs avec leur propre index
Les index à suivre notamment :
➡️ wiby.me
➡️ marginalia.nu
➡️ lstu.fr
Contributeur(s): marmotte, Ayo

