Co to jest Reranking (przeszeregowanie wyników)?

Słownik AI

Reranking (przeszeregowanie wyników)

reranking, przeszeregowanie wyników, re-ranking, cross-encoder

Reranking to drugi etap wyszukiwania, w którym osobny model porządkuje wstępne wyniki według faktycznej trafności, zanim najlepsze z nich trafią do modelu językowego. Podnosi jakość odpowiedzi w RAG.

To drugi etap po szybkim wyszukiwaniu wstępnym — przegląda kandydatów i ustawia ich w kolejności trafności.
Model rerankingu ocenia parę pytanie–fragment razem, dlatego jest dokładniejszy niż samo porównanie wektorów.
Zmniejsza ryzyko, że do modelu trafi nietrafny kontekst, więc poprawia jakość odpowiedzi RAG.

Reranking to etap, który wstawia się pomiędzy wyszukiwanie a generację odpowiedzi. Najpierw szybki mechanizm — zwykle oparty na embeddingach i porównaniu wektorów — wybiera szeroką pulę kandydatów, na przykład pięćdziesiąt fragmentów. Następnie model rerankingu ocenia każdego kandydata względem pytania i układa je od najbardziej do najmniej trafnego, po czym do modelu językowego przekazuje się tylko kilka najlepszych.

Różnica wobec samego wyszukiwania semantycznego jest istotna: wyszukiwanie wektorowe porównuje wcześniej policzone reprezentacje pytania i fragmentu osobno, co jest szybkie, ale przybliżone. Model rerankingu analizuje pytanie i fragment wspólnie, dzięki czemu wychwytuje niuanse trafności, które umykają samym wektorom. Cena za to jest taka, że jest wolniejszy — dlatego stosuje się go na małej puli, a nie na całej bazie.

We wdrożeniu RAG reranking jest jednym z najtańszych sposobów poprawy jakości bez przebudowy całego systemu. Gdy model odpowiada poprawnie, ale „mija się” z intencją pytania, problemem bywa nie sam generator, lecz to, że do kontekstu trafiały słabo dopasowane fragmenty — i właśnie to porządkuje reranking.

Powiązane pojęcia