Se connecter
Se connecter

ou
Créer un compte

ou

Amélioration du moteur de recherche

  • 26 réponses
  • 7 participants
  • 1 702 vues
  • 7 followers
Sujet de la discussion Amélioration du moteur de recherche
Hello,

Je créé ce sujet afin de recenser ici les éventuels problèmes de fonctionnement du moteur de recherche du site dans le but de l'améliorer. Merci de poster ici si vous estimez qu'il ne remonte pas ou remonte mal certains résultats .

Merci également de préciser de quel moteur de recherche il s'agit (produits, forums, petites annonces, etc.).

Pour rappel, Audiofanzine contient en gros un moteur de recherche par type de contenu. Le moteur de recherche "général" qui se trouve en haut et en bas de toutes les pages recherche dans les catégories, les marques et les produits.
2
Salut Nero,
concernant le moteur de recherche général, l'algo de proximité rapporte des fois des résultats peut pertinent : par exemple si je cherche la marque moog et que je tape "moug" ça ne remonte rien de pertinent, même si la recherche google prend le relais de temps en temps elle reste pénible (il y a la pub qui vient polluer).
Rien de grave, mais parfois on s'y reprend à plusieurs fois.

Un autre exemple, si je tape "jm music" il me sort une liste de produit contenant la chaine "jm music". Alors qu'en fait je cherche le membre audiofanzine "jm music" qui est le résultat le plus pertinent. Si on utilise la recherche google c'est bien la page du membre que google nous propose.
Si bien sûr on va dans membre ont le trouve direct mais c'est plus compliqué à utiliser comme option et faut surtout y penser !

[ Dernière édition du message le 25/02/2013 à 12:54:45 ]

3
Hello,

Je recherchais un produit, dont je n'avais plus le nom exact, de la marque "plug & play".
Bon bah le problème c'est que je tapais "plug and play" et que du coup les résultats n'était pas bon. Ça doit pouvoir se corriger facilement ça, non? :oops:

Merci bien

.:MonSoundCloud:.

 

Le Seigneur des Marteaux
"Un marteau pour les aplatir tous."

4
Citation de bouyakaboy :
Salut Nero,
concernant le moteur de recherche général, l'algo de proximité rapporte des fois des résultats peut pertinent : par exemple si je cherche la marque moog et que je tape "moug" ça ne remonte rien de pertinent, même si la recherche google prend le relais de temps en temps elle reste pénible (il y a la pub qui vient polluer).
Rien de grave, mais parfois on s'y reprend à plusieurs fois.

Hello,
Effectivement sur les recherches proches y'a du boulot... je vais essayer différents algos mais j'ai peur qu'au final on perde en pertinence sur les requêtes tappées correctement.

Citation de bouyakaboy :

Un autre exemple, si je tape "jm music" il me sort une liste de produit contenant la chaine "jm music". Alors qu'en fait je cherche le membre audiofanzine "jm music" qui est le résultat le plus pertinent. Si on utilise la recherche google c'est bien la page du membre que google nous propose.
Si bien sûr on va dans membre ont le trouve direct mais c'est plus compliqué à utiliser comme option et faut surtout y penser !

Oui il faudrait dans ce cas rechercher directement dans le moteur de recherche membres... On est malheureusement pas Google et la recherche sur Audiofanzine est compartimentée par type de contenu. Le moteur général recherche dans les catégories, les marques et les produits (ce qui est de loin le plus tapé)... Pour le reste il faut choisir l'onglet adapté. Dans l'état actuel des choses, si on recherchait partout en même temps, on perdrait en performances et cela ralentirait le site. Je pourrai le faire de manière incrémentielle en recherchant dans les autres types de contenus lorsque la requête ne remonte rien dans les produits mais il se trouve dans ton exemple qu'une recherche sur "jm music" retourne des produits...

Merci pour ton retour en tout cas, je vais essayer de voir ce que l'on peut améliorer en ce sens. Peut-être même pourquoi pas faire des tests avec une recherche globale à la Google pour voir l'impact que cela a sur nos serveurs.
5
Citation de steve.lukather :
Hello,

Je recherchais un produit, dont je n'avais plus le nom exact, de la marque "plug & play".
Bon bah le problème c'est que je tapais "plug and play" et que du coup les résultats n'était pas bon. Ça doit pouvoir se corriger facilement ça, non? :oops:

Merci bien

Effectivement ça, ça peut se corriger facilement :) J'ai fait la modif et ça devrait être bon d'ici 1h max.
6
Merci Nero!

.:MonSoundCloud:.

 

Le Seigneur des Marteaux
"Un marteau pour les aplatir tous."

7
Citation :
Hello,
Effectivement sur les recherches proches y'a du boulot... je vais essayer différents algos mais j'ai peur qu'au final on perde en pertinence sur les requêtes tappées correctement.

C'est effectivement souvent le problème et l'algo n'est en effet pas facile à doser des ces cas là. Je ne sais pas quel algo tu utilise mais j'imagine que tu fais en parti du full text search avec mysql.

Citation :
Dans l'état actuel des choses, si on recherchait partout en même temps, on perdrait en performances et cela ralentirait le site. Je pourrai le faire de manière incrémentielle en recherchant dans les autres types de contenus lorsque la requête ne remonte rien dans les produits mais il se trouve dans ton exemple qu'une recherche sur "jm music" retourne des produits...

C'est sûr que les perfs quand il y a un gros volume de données c'est problématique, surtout qu'elles sont très bonne aujourd'hui, ce serait dommage de les dégrader.
Que "JM music" retourne des produit c'est très bien est normal, mais ça reste quand même un "perfect match" pour un user du site, je pense que ça mériterais un boost au niveau du résultat. Mais si tu fais de l'incrémentiel c'est là que le problème se pose. Comment décider d'aller plus loin dans la recherche ou pas...Si on a des résultats en amont.
A mon sens ce n'est pas la bonne méthode.
Je pense que la recherche "à la google" serait une bonne chose si tu arrives à tirer des perfs correct. Parce que déjà la recherche personnalisé google c'est plutôt galère avec ses pub et en plus j'imagine que l'indexation est au bon vouloir de google.
Mais ça permettra aussi de catégoriser(ranger) les résultat dans la page, continuer sur ce que vous faites déjà quoi, mais avec un peut plus de données.

Je ne sais pas si tu utilises mysql pour tes recherches mais de toute façon niveau perf un jour ça risque de coincer. C'est pour ça que je pense que c'est plus avantageux de passer sur un index plus performant, plus maleable et plus scalable (autre serveur, plus de contrainte MyISAM etc).
D'ou mon idée de stage de se pencher sur une solution Lucene SolR.
Mais bon j'imagine que vous avez un maximum de pain déjà sur la planche :-)

[ Dernière édition du message le 26/02/2013 à 19:38:11 ]

8
On a laissé tomber la recherche FULLTEXT MySQL depuis bien longtemps :-D

Même Lucene n'était pas satisfaisant. On utilise Sphinx depuis plus de 2 ans. C'est un très bon outil qui donne de très bons résultats, même s'il faut qu'on continue à améliorer les choses mais là c'est plutôt au niveau du code que ça se joue maintenant...
9
Autant pour moi !
Je ne connais sphinx que de nom et il a bonne réputation.
Donc effectivement il reste qu'à tweaker légèrement quelques algos. C'est sans fin.

x
Hors sujet :
Même Lucene n'était pas satisfaisant
Lucène en natif ?
ou le portage ZEND framework ?
10
x
Hors sujet :
le portage Zend Framework effectivement.

[ Dernière édition du message le 27/02/2013 à 09:58:33 ]