Przewodnik
Dla funduszy PE
AI/IT due diligence: jak ocenić „AI” spółki, zanim podpiszesz
AI due diligence oddziela realną zdolność od nakładki na cudzy model i długu danych. Time-boxowany przegląd ryzyka, który zmieści się w prezentacji dla zarządu.
- Większość „AI” w spółkach to nakładka na cudzy model — sprawdź, co spółka naprawdę kontroluje.
- Dług danych i brak ewaluacji są kosztowniejsze niż brak modelu, bo zostają po zamknięciu.
- Time-box: dwa–trzy tygodnie wystarczą na board-readable mapę ryzyka, jeśli pytasz o właściwe rzeczy.
Po co osobna ścieżka dla AI
Standardowe due diligence sprawdza finanse, prawo i technologię. „AI” wymyka się tym trzem, bo spółka może pokazać działające demo, kilka logotypów klientów i deck pełen wykresów, a pod spodem mieć cienką nakładkę na cudzy model bez żadnej trwałej przewagi. Ryzyko nie jest w tym, że AI nie działa. Ryzyko jest w tym, że płacisz za zdolność, której spółka nie kontroluje.
Audyt AI to time-boxowany przegląd, który odpowiada na jedno pytanie zarządu: czy to, co spółka nazywa AI, jest aktywem, czy kosztem operacyjnym przebranym za aktywo. Prowadzisz go równolegle do reszty due diligence, w dwa–trzy tygodnie, i kończysz mapą ryzyka, nie esejem.
Trzy warstwy, które trzeba rozdzielić
Większość mylących ocen bierze się z mieszania trzech rzeczy w jedno hasło „AI”.
- Model. Najczęściej to gotowy LLM dostawcy zewnętrznego. Sam w sobie nie jest przewagą — ten sam model ma konkurencja.
- Dane. Tu zwykle leży realna wartość: zastrzeżone, czyste, dobrze opisane dane treningowe albo baza wiedzy, której nikt nie odtworzy z dnia na dzień.
- System wokół. Pipeline, RAG na firmowych dokumentach, ewaluacja, guardraile, integracje. To pokazuje, czy zespół umie zamienić model w produkt.
Spółka z silną warstwą danych i systemu na słabszym modelu jest zwykle bezpieczniejsza niż spółka z najnowszym modelem i pustką pod spodem. Model można podmienić w tydzień. Danych i pipeline'u nie.
Co sprawdzić, a co jest sygnałem ryzyka
To jest sedno przeglądu. Każdy wiersz tłumaczy, czego szukasz i co powinno zapalić lampkę.
| Co sprawdzić | Sygnał ryzyka |
|---|---|
| Skąd pochodzi model | Wyłącznie cudze API bez własnej warstwy danych ani planu wyjścia |
| Pochodzenie danych treningowych | Brak udokumentowanych źródeł, zgód i licencji; dane „skądś” |
| Czy istnieje ewaluacja | Ocena jakości „na wyczucie”, brak stałego zbioru testowego i metryk |
| Koszt jednej odpowiedzi | Marża zależna od cennika dostawcy, którego spółka nie negocjuje |
| Zależność od jednego dostawcy | Pełny lock-in, brak abstrakcji nad modelem, brak alternatywy |
| Kto zbudował system | Cała wiedza w jednej osobie albo u zewnętrznego wykonawcy |
| Co dzieje się przy błędzie | Brak guardraili, brak człowieka w pętli przy decyzjach o wysokiej stawce |
Jeśli na większość tych pytań spółka odpowiada slajdem z architekturą zamiast dowodem, to sam slajd jest odpowiedzią.
Dług danych: najdroższe, co kupujesz
Dane treningowe bywają największym ukrytym zobowiązaniem. Model wytrenowany na danych bez udokumentowanych zgód, na scrapowanych treściach albo na danych klientów użytych niezgodnie z umową to nie aktywo, lecz odroczone ryzyko prawne, które zostaje po stronie kupującego po zamknięciu.
Pytaj wprost: skąd pochodzi każdy zbiór, na jakiej podstawie, czy da się to udowodnić w razie kontroli. Brak odpowiedzi traktuj jak brak tytułu prawnego do nieruchomości — bo ekonomicznie to to samo.
Jak zmieścić to w decyzji zarządu
Wynik przeglądu ma być board-readable, czyli krótki i porównywalny. Sprawdza się prosty format.
- Werdykt w jednym zdaniu. Aktywo, nakładka albo aktywo z warunkami.
- Trzy największe ryzyka z szacowanym kosztem ich naprawy lub domknięcia.
- Co trzeba zrobić w pierwszych 100 dniach, żeby ryzyko zamienić w wartość.
Zasada operatora: nie pytaj „czy spółka ma AI”. Pytaj „co się stanie z marżą, jeśli dostawca modelu jutro podniesie ceny albo zmieni warunki”. Odpowiedź na to drugie pytanie mówi, co naprawdę kupujesz.
Od czego zacząć
Pierwszy krok jest tani: poproś o jeden konkretny dowód jakości — stały zbiór testowy, wynik ewaluacji, udokumentowane źródło danych. Spółka, która naprawdę kontroluje swoje AI, pokaże to w ciągu kilku dni. Spółka, która ma nakładkę, zacznie tłumaczyć, dlaczego to skomplikowane. Ta różnica w reakcji bywa cenniejsza niż sam deck.
Pojęcia w tym przewodniku
- Audyt AI
- LLM (duży model językowy)
- RAG (Retrieval-Augmented Generation)
- Ewaluacja modeli
- Dane treningowe
Oceniasz spółkę albo portfel pod kątem AI? Opisz swój przypadek.
Opisz swój przypadek Zobacz, jak pomagamyNajczęstsze pytania
- Jak długo trwa AI due diligence?
- Dla pojedynczej spółki dwa–trzy tygodnie na przegląd zdolności, danych i kosztu modelu. To wariant techniczny standardowego due diligence, prowadzony równolegle, nie zamiast niego.
- Co odróżnia realną zdolność AI od nakładki?
- Realna zdolność oznacza własne dane, ewaluację i kontrolę nad pipeline'em. Nakładka to cienka warstwa na cudzym API — łatwa do skopiowania i wrażliwa na zmiany cennika dostawcy.
- Czy brak własnego modelu to sygnał ryzyka?
- Niekoniecznie. Korzystanie z gotowego modelu bywa rozsądne. Ryzykiem jest brak własnych danych, brak pomiaru jakości i pełna zależność od jednego dostawcy bez planu wyjścia.