Beta Space StudioBeta Space Studio logo

Vektör nedir?

Onat Vural
Onat Vural
2 dk okuma
Vektör nedir?

Yapay Zeka nasıl her şeye saniyeler içerisinde cevap veriyor?

Tıpkı deneyimli bir çalışanın yıllar içinde edindiği bilgileri anında hatırlayıp size cevap vermesi gibi, yapay zeka da önceden vektör veri bankasına işlediği bilgileri kullanarak saniyeler içinde yanıt üretir. Bu hız, bilgileri vektör olarak özel bir şekilde organize etmesinden gelir.

Vektör Nedir?

Vektörü, bir kelimenin veya cümlenin uzaydaki "adresi" olarak düşünün. Tıpkı bir şehirdeki her binanın enlem-boylam koordinatları olması gibi, her kelime de çok boyutlu bir uzayda belirli bir noktada bulunur.

Örneğin:

"Kedi" kelimesi uzayda (5, 3, 8) noktasında

"Köpek" kelimesi (5, 4, 7) noktasında

"Araba" kelimesi (2, 9, 1) noktasında olabilir

Dikkat ederseniz "kedi" ve "köpek" birbirine yakın koordinatlarda çünkü ikisi de evcil hayvan. "Araba" ise çok farklı bir noktada çünkü bambaşka bir kavram.

Vektör ve Semantik Aramanın İlişkisi

Bu uzaysal düzenleme sayesinde, yapay zekâ "bana evcil hayvanlarla ilgili bilgi ver" dediğinizde, o bölgedeki tüm noktaları (kedi, köpek, kuş, hamster) tarar. Tıpkı "Kadıköy'de restoran arıyorum" dediğinizde haritanın Kadıköy bölgesine bakmanız gibi, sistem de anlamca yakın kelimelerin bulunduğu uzay bölgesine bakar.

Gelin Test Edelim

Father - Mother + Uncle = ?

Bu denklemi ChatGPT veya dilediğiniz bir yapay zekâya sorun. Eğer iyi bir "embedding" modeline "reasoning" modeline sahipse cevabı size "aunt" olarak verecektir.

Not: *Hızlı çalışan veya düşük düşünme kapasiteli modeller 4.1-mini gibi sizi cevapsız bırakmamak için rastgele cümleler sıralayacaktır.

İyi Bir Vektör Veri Tabanının Püf Noktaları

1. Doğru "Çevirmen" Seçimi (Embedding Model)

Türkçe'yi iyi anlayan bir model seçilmeli, yoksa sistem "maaş artışı" ile "maaş kesintisi"ni ayırt edemez.

2. Verilerinizi Doğru Boyutta Bölme (Chunk Size)

Metinleri ne çok uzun (bağlam kaybolur) ne çok kısa (anlam bölünür) parçalara ayrılmalı, tıpkı yemekte lokma büyüklüğü gibi.

3. Temiz Veri Hazırlığı

PDF'lerdeki tablolar, görseller, başlıklar düzgün ayrıştırılmalı ki sistem karmakarışık bilgi vermesin.

4. Akıllı Etiketleme (Metadata)

Her belgeye "tarih, departman, hazırlayan" gibi etiketler eklenmeli ki sonra kolayca filtreleyebilin.

Peki Ya Sizin Verileriniz?

Bir düşünün: Şirketinizde kaç yıllık bilgi birikimi var? Kaç rapor, kaç e-posta, kaç doküman?

Muhtemelen bir çalışanınız "Geçen yıl X müşterisi için hazırladığımız teklifi bulabilir miyiz?" diye sorduğunda, herkes saatlerce aramaya başlıyor. Ya da yeni başlayan biri, 3 yıl önce çözülmüş bir problemi baştan çözmeye çalışıyor.

İşte tam bu noktada vektör veri tabanları devreye giriyor.

Nasıl çalıştığını merak ediyorsanız, size kendi oluşturduğumuz örnekleri gösterebiliriz.

hello@betaspacestudio.com

Vektör nedir? | Beta Space Studio