Se connecter
Se connecter

ou
Créer un compte

ou
FR
EN

Amélioration du moteur de recherche

  • 26 réponses
  • 7 participants
  • 1 807 vues
  • 7 followers
Sujet de la discussion Amélioration du moteur de recherche
Hello,

Je créé ce sujet afin de recenser ici les éventuels problèmes de fonctionnement du moteur de recherche du site dans le but de l'améliorer. Merci de poster ici si vous estimez qu'il ne remonte pas ou remonte mal certains résultats .

Merci également de préciser de quel moteur de recherche il s'agit (produits, forums, petites annonces, etc.).

Pour rappel, Audiofanzine contient en gros un moteur de recherche par type de contenu. Le moteur de recherche "général" qui se trouve en haut et en bas de toutes les pages recherche dans les catégories, les marques et les produits.
2
Salut Nero,
concernant le moteur de recherche général, l'algo de proximité rapporte des fois des résultats peut pertinent : par exemple si je cherche la marque moog et que je tape "moug" ça ne remonte rien de pertinent, même si la recherche google prend le relais de temps en temps elle reste pénible (il y a la pub qui vient polluer).
Rien de grave, mais parfois on s'y reprend à plusieurs fois.

Un autre exemple, si je tape "jm music" il me sort une liste de produit contenant la chaine "jm music". Alors qu'en fait je cherche le membre audiofanzine "jm music" qui est le résultat le plus pertinent. Si on utilise la recherche google c'est bien la page du membre que google nous propose.
Si bien sûr on va dans membre ont le trouve direct mais c'est plus compliqué à utiliser comme option et faut surtout y penser !

[ Dernière édition du message le 25/02/2013 à 12:54:45 ]

3
Hello,

Je recherchais un produit, dont je n'avais plus le nom exact, de la marque "plug & play".
Bon bah le problème c'est que je tapais "plug and play" et que du coup les résultats n'était pas bon. Ça doit pouvoir se corriger facilement ça, non? :oops:

Merci bien

.:MonSoundCloud:.

 

Le Seigneur des Marteaux
"Un marteau pour les aplatir tous."

4
Citation de bouyakaboy :
Salut Nero,
concernant le moteur de recherche général, l'algo de proximité rapporte des fois des résultats peut pertinent : par exemple si je cherche la marque moog et que je tape "moug" ça ne remonte rien de pertinent, même si la recherche google prend le relais de temps en temps elle reste pénible (il y a la pub qui vient polluer).
Rien de grave, mais parfois on s'y reprend à plusieurs fois.

Hello,
Effectivement sur les recherches proches y'a du boulot... je vais essayer différents algos mais j'ai peur qu'au final on perde en pertinence sur les requêtes tappées correctement.

Citation de bouyakaboy :

Un autre exemple, si je tape "jm music" il me sort une liste de produit contenant la chaine "jm music". Alors qu'en fait je cherche le membre audiofanzine "jm music" qui est le résultat le plus pertinent. Si on utilise la recherche google c'est bien la page du membre que google nous propose.
Si bien sûr on va dans membre ont le trouve direct mais c'est plus compliqué à utiliser comme option et faut surtout y penser !

Oui il faudrait dans ce cas rechercher directement dans le moteur de recherche membres... On est malheureusement pas Google et la recherche sur Audiofanzine est compartimentée par type de contenu. Le moteur général recherche dans les catégories, les marques et les produits (ce qui est de loin le plus tapé)... Pour le reste il faut choisir l'onglet adapté. Dans l'état actuel des choses, si on recherchait partout en même temps, on perdrait en performances et cela ralentirait le site. Je pourrai le faire de manière incrémentielle en recherchant dans les autres types de contenus lorsque la requête ne remonte rien dans les produits mais il se trouve dans ton exemple qu'une recherche sur "jm music" retourne des produits...

Merci pour ton retour en tout cas, je vais essayer de voir ce que l'on peut améliorer en ce sens. Peut-être même pourquoi pas faire des tests avec une recherche globale à la Google pour voir l'impact que cela a sur nos serveurs.
5
Citation de steve.lukather :
Hello,

Je recherchais un produit, dont je n'avais plus le nom exact, de la marque "plug & play".
Bon bah le problème c'est que je tapais "plug and play" et que du coup les résultats n'était pas bon. Ça doit pouvoir se corriger facilement ça, non? :oops:

Merci bien

Effectivement ça, ça peut se corriger facilement :) J'ai fait la modif et ça devrait être bon d'ici 1h max.
6
Merci Nero!

.:MonSoundCloud:.

 

Le Seigneur des Marteaux
"Un marteau pour les aplatir tous."

7
Citation :
Hello,
Effectivement sur les recherches proches y'a du boulot... je vais essayer différents algos mais j'ai peur qu'au final on perde en pertinence sur les requêtes tappées correctement.

C'est effectivement souvent le problème et l'algo n'est en effet pas facile à doser des ces cas là. Je ne sais pas quel algo tu utilise mais j'imagine que tu fais en parti du full text search avec mysql.

Citation :
Dans l'état actuel des choses, si on recherchait partout en même temps, on perdrait en performances et cela ralentirait le site. Je pourrai le faire de manière incrémentielle en recherchant dans les autres types de contenus lorsque la requête ne remonte rien dans les produits mais il se trouve dans ton exemple qu'une recherche sur "jm music" retourne des produits...

C'est sûr que les perfs quand il y a un gros volume de données c'est problématique, surtout qu'elles sont très bonne aujourd'hui, ce serait dommage de les dégrader.
Que "JM music" retourne des produit c'est très bien est normal, mais ça reste quand même un "perfect match" pour un user du site, je pense que ça mériterais un boost au niveau du résultat. Mais si tu fais de l'incrémentiel c'est là que le problème se pose. Comment décider d'aller plus loin dans la recherche ou pas...Si on a des résultats en amont.
A mon sens ce n'est pas la bonne méthode.
Je pense que la recherche "à la google" serait une bonne chose si tu arrives à tirer des perfs correct. Parce que déjà la recherche personnalisé google c'est plutôt galère avec ses pub et en plus j'imagine que l'indexation est au bon vouloir de google.
Mais ça permettra aussi de catégoriser(ranger) les résultat dans la page, continuer sur ce que vous faites déjà quoi, mais avec un peut plus de données.

Je ne sais pas si tu utilises mysql pour tes recherches mais de toute façon niveau perf un jour ça risque de coincer. C'est pour ça que je pense que c'est plus avantageux de passer sur un index plus performant, plus maleable et plus scalable (autre serveur, plus de contrainte MyISAM etc).
D'ou mon idée de stage de se pencher sur une solution Lucene SolR.
Mais bon j'imagine que vous avez un maximum de pain déjà sur la planche :-)

[ Dernière édition du message le 26/02/2013 à 19:38:11 ]

8
On a laissé tomber la recherche FULLTEXT MySQL depuis bien longtemps :-D

Même Lucene n'était pas satisfaisant. On utilise Sphinx depuis plus de 2 ans. C'est un très bon outil qui donne de très bons résultats, même s'il faut qu'on continue à améliorer les choses mais là c'est plutôt au niveau du code que ça se joue maintenant...
9
Autant pour moi !
Je ne connais sphinx que de nom et il a bonne réputation.
Donc effectivement il reste qu'à tweaker légèrement quelques algos. C'est sans fin.

x
Hors sujet :
Même Lucene n'était pas satisfaisant
Lucène en natif ?
ou le portage ZEND framework ?
10
x
Hors sujet :
le portage Zend Framework effectivement.

[ Dernière édition du message le 27/02/2013 à 09:58:33 ]

11
Je reviens pour un truc : on pourrait pas avoir des suggestiosn dans la barre de recherche? J'imagine que ça c'est pas facile à mettre en place. Ça permettrait de retrouver un produit dont on est pas sûr du nom ou d'avoir directement accès à plusieurs choix et aller directement au bon produit.
Par exemple je commence à taper "saffi" et on me propose tout le matériel de la série saffire de focusrite.

.:MonSoundCloud:.

 

Le Seigneur des Marteaux
"Un marteau pour les aplatir tous."

12
C'est déjà le cas si tu utilise le moteur de recherche interne au matériel et instrument.
Mais effectivement sur la recherche générale il n'y a rien.
Ce n'est pas plus mal je pense dans ce cas là.
13
x
Hors sujet :
Citation :
le portage Zend Framework effectivement.

Dans ces cas là niveau perf ça ne m'étonne pas trop que lucène soit à la ramasse et ne fasse pas l'affaire.

En tous cas les perfs de Sphinx sont très bonne visiblement,
La recherche répond bien.:bravo:

[ Dernière édition du message le 27/02/2013 à 12:25:54 ]

14
@bouyakaboy : je vois pas où... :???:

.:MonSoundCloud:.

 

Le Seigneur des Marteaux
"Un marteau pour les aplatir tous."

15
par exemple sur cette page : https://fr.audiofanzine.com/instrument-materiel-audio/
en dessous de l'onglet produit il y a un champ de saisi.
Si tu commence à taper un produit la liste des résultats se met à jour en live.
16
Ah bah je l'avais jamais vu ça. Je devais toujours taper trop vite et appuyer sur Entrée avant que ça se mette à jour.

.:MonSoundCloud:.

 

Le Seigneur des Marteaux
"Un marteau pour les aplatir tous."

17
Un autre résultat de recherche un peut bizzare : "uad quad"

Il ne me retourne rien sur les cartes uad !:fache2:
Il faut passer sur la recherche google pour trouver des résultats pertinents.

nero une idée ?

[ Dernière édition du message le 28/02/2013 à 16:14:19 ]

18
Pour "uad quad" c'est vraiment bizarre j'avoue... je vais me pencher sur le problème...
19
Salut Nero,

Concernant le moteur de recherche forum dans le sujet https://fr.audiofanzine.com/le-pub-des-gentlemen/forums/t.373050,raskolnikov-s-freaky-animal-theater,p.121.html (par exemple) j'ai fait une recherche avec le terme tardigrade avant de poster mon message : je n'ai eu aucun résultats.

Maintenant si je fais la même recherche mais avec le terme tardigrades je retrouve un poste de Guig-Z de 2010 qui parle de la même bestiole...

Je ne saisis pas très bien pourquoi le terme au singulier ne renvoit pas aussi des résultats avec le terme au pluriel (question de perfs ?) :?!:

Quand mon verre est vide, j'le plains. Quand mon verre est plein,j'le vide.

20
Salut,

C'est toujours l'éternel problème. La machine n'est pas suffisamment intelligente pour faire la distinction singulier/pluriel. En fait, de la manière dont il est configuré là, il cherche les termes que tu as entré comme des mots entiers. "Strat" ne remontera donc pas "Stratocaster". Je peux changer ce fonctionnement mais :
  • les résultats risquent d'être différents avec parfois des effets de bord pas forcément désirés. Une recherche sur la couleur "vert" remontera "convertisseurs" par exemple.
  • il se peut effectivement que ça impacte la performance vu la taille des forums


On peut éventuellement faire des tests pour voir ce que ça donne.

[ Dernière édition du message le 09/09/2013 à 09:50:43 ]

21
Merci Nero, je comprend mieux le souci.
Pour le coup, si je cherche "strat", intuitivement j'aimerais plus avoir des résultats comme avec un like 'strat%' donc avoir les singuliers et pluriels, la déclinaison courte et "strats" que des citations d'un modo qui n'a pas les mêmes valeurs. :oops2:
Corrige moi si je me trompe mais il me semble qu'il fut un temps où on pouvait utiliser les jokers directement dans les recherches ?

Quand mon verre est vide, j'le plains. Quand mon verre est plein,j'le vide.

22
x
Hors sujet :
Après quelques tests, effectivement sphinx ça roxxe pas mal du poney. :bravo: C'est même plus performant (C++ oblige...) que Solr pour certaines requêtes et j'ai même pas optimisé le bouzin. Y'a moyen de tweaker amha.

Quand mon verre est vide, j'le plains. Quand mon verre est plein,j'le vide.

[ Dernière édition du message le 09/09/2013 à 17:55:03 ]

23
Bonjour,
concernant le moteur de recherche, je constate que depuis quelques jours, une recherche avec "&" par exemple ne marche pas.
typiquement si je cherche G&L, c'est KO.
celà fonctionnait avant.
Merci
24
Hello, effectivement y'avait une sécurité un peu trop stricte. Ça devrait aller mieux maintenant.
25
Bonsoir,
en effet c'est mieux, mais y'a toujours un soucis.
si je cherche g&l(oui, je suis accroc ;) ) dans la barre de recherche générale, ça fonctionne. en cliquant sur la marque puis sur annonces, j'ai bien les annonces.
par contre si je met la même chose dans la barre de recherche des petites annonces, c'est KO et ça renvoie "g&l" dans la barre de recherche générale.
@+