Słownik AI
Reranking (przeszeregowanie wyników)
reranking, przeszeregowanie wyników, re-ranking, cross-encoder
Reranking to drugi etap wyszukiwania, w którym osobny model porządkuje wstępne wyniki według faktycznej trafności, zanim najlepsze z nich trafią do modelu językowego. Podnosi jakość odpowiedzi w RAG.
- To drugi etap po szybkim wyszukiwaniu wstępnym — przegląda kandydatów i ustawia ich w kolejności trafności.
- Model rerankingu ocenia parę pytanie–fragment razem, dlatego jest dokładniejszy niż samo porównanie wektorów.
- Zmniejsza ryzyko, że do modelu trafi nietrafny kontekst, więc poprawia jakość odpowiedzi RAG.
Reranking to etap, który wstawia się pomiędzy wyszukiwanie a generację odpowiedzi. Najpierw szybki mechanizm — zwykle oparty na embeddingach i porównaniu wektorów — wybiera szeroką pulę kandydatów, na przykład pięćdziesiąt fragmentów. Następnie model rerankingu ocenia każdego kandydata względem pytania i układa je od najbardziej do najmniej trafnego, po czym do modelu językowego przekazuje się tylko kilka najlepszych.
Różnica wobec samego wyszukiwania semantycznego jest istotna: wyszukiwanie wektorowe porównuje wcześniej policzone reprezentacje pytania i fragmentu osobno, co jest szybkie, ale przybliżone. Model rerankingu analizuje pytanie i fragment wspólnie, dzięki czemu wychwytuje niuanse trafności, które umykają samym wektorom. Cena za to jest taka, że jest wolniejszy — dlatego stosuje się go na małej puli, a nie na całej bazie.
We wdrożeniu RAG reranking jest jednym z najtańszych sposobów poprawy jakości bez przebudowy całego systemu. Gdy model odpowiada poprawnie, ale „mija się” z intencją pytania, problemem bywa nie sam generator, lecz to, że do kontekstu trafiały słabo dopasowane fragmenty — i właśnie to porządkuje reranking.
Powiązane pojęcia