Beta Space StudioBeta Space Studio logo

Yapay Zekanın Yeni Gözdesi RAG: Gördüğünüz Sadece Buzdağının Görünen Kısmı

Said Sürücü
Said Sürücü
5 dk okuma
Yapay Zekanın Yeni Gözdesi RAG: Gördüğünüz Sadece Buzdağının Görünen Kısmı

Kapak görseli: Gizem Akdağ

Yapay zeka dünyasını takip ediyorsanız, son zamanlarda iki terimi duymamış olmanız imkansız: RAG (Retrieval-Augmented Generation) ve Yapay Zeka Ajanları (AI Agents). Bu iki teknoloji, dil modellerinin (LLM) yeteneklerini "kendi hafızalarıyla" sınırlı olmaktan çıkarıp, onları gerçek zamanlı, harici verilere bağlayan bir devrimi temsil ediyor.

Peki, bir anda nasıl oldu da yapay zeka, statik bir bilgi ansiklopedisinden, şirketinizin özel dokümanlarını okuyup size özet çıkaran proaktif bir asistana dönüştü? Cevap, "arama" (search) teknolojisinin evriminde yatıyor.

Aramanın Evrimi: dir *.txt'den Vektörlere

Bilgiye erişim tarihimiz, aslında giderek daha "anlamsal" hale gelen bir yolculuktur:

1. Anahtar Kelime Araması (Geçmiş)

Bilgisayar kullanımının ilk günlerini düşünün. Bir MS-DOS komut satırında dir *rapor*.txt yazmak, içinde "rapor" kelimesi geçen dosyaları bulmanın tek yoluydu. Bu, tam eşleşmeye dayalı, bağlamdan tamamen yoksun bir aramaydı. İnternetin ilk arama motorları da (Altavista gibi) büyük ölçüde böyle çalışıyordu.

2. Semantik Arama (Günümüz)

Google'ın devrimi burada başladı. "İstanbul'da hafta sonu yapılacak en iyi şey" yazdığınızda, Google bu kelimelerin tam olarak geçtiği sayfaları değil, sizin "İstanbul'da etkinlik aradığınızı" anlar. Niyetinizi (intent) çözümler. Bu, anahtar kelimelerin ötesine geçen bir anlayıştı.

3. Vektör Araması (Gelecek ve RAG)

Şimdi ise "anlam" arıyoruz. Vektör araması, kelimelerin, cümlelerin ve hatta resimlerin kavramsal anlamını matematiksel bir uzayda (vektör) temsil eder. Artık "mutlu bir köpek fotoğrafı" aradığınızda, sistem "mutluluk" ve "köpek" kavramlarına anlamsal olarak en yakın olan görselleri getirir.

Günümüzdeki en iyi örneklerden biri Spotify'ın öneri motorudur. Spotify, dinlediğiniz şarkıların sadece türüne veya sanatçısına bakmaz. Şarkının ses özelliklerini (tempo, akustiklik, enerji) ve internette o şarkı hakkında yazılanları (bloglar, incelemeler) analiz ederek "kültürel vektörler" oluşturur. Sizin "hafta sonu sabahı kahve içerken dinlenecek melankolik ama umutlu şarkılar" olan hissinize en yakın vektörleri bularak öneri yapar. Bu, geleneksel aramanın fersah fersah ötesinde bir yetenektir.

Vektör Araması Her Derde Deva Değildir

RAG ve vektör veritabanları o kadar popüler hale geldi ki, sektörde "her problemi vektörle çözelim" gibi tehlikeli bir eğilim baş gösterdi.

Ancak vektör araması sihirli bir değnek değil.

Eğer veriniz yüksek oranda yapılandırılmışsa (structured data), yani net satırları ve sütunları olan bir tablodaysa, 50 yıllık SQL veritabanları hala rakipsizdir.

  • "İstanbul'daki hangi müşteriler son 3 ayda X ürününü satın aldı?"
  • "Stokta 10 adetten az kalan ürünler hangileri?"

Bu tür kesin soruları anlamsal bir vektör uzayında aramak, hem verimsiz hem de maliyetlidir. Bu soruların cevabı bulanık (fuzzy) bir "benzerlik" değil, net bir SELECT sorgusudur. Vektör veritabanları "anlam" ve "bağlam" aramak için, SQL veritabanları ise "gerçekler" (facts) ve "ilişkiler" (relations) için kullanılır. Doğru aracı doğru iş için seçmek, sistemin verimliliği için hayatidir.

%10 Veritabanı, %90 Doğru Strateji

Sektörde gördüğüm en büyük yanılgı şu: "Tüm PDF'lerimizi ve dokümanlarımızı bir vektör veritabanına atalım, RAG sistemi kurulsun."

Bu yaklaşım, bir kütüphanedeki tüm kitapları rastgele bir odaya yığmaktan farksızdır. Evet, teknik olarak tüm bilgi oradadır, ancak hiçbir şey bulunamaz.

Bir vektör veritabanı projesinde başarıyı belirleyen 90/10 kuralı vardır:

  • %10 Teknik Kurulum: Veritabanını kurmak, dokümanları yüklemek ve vektörlere dönüştürmek işin kolay ve teknik kısmıdır.
  • %90 Strateji ve Metadata: Başarıyı getiren asıl kısım burasıdır. Bu %90'lık dilim, veriyi tanımayı ve sınıflandırmayı (classification) içerir.

Bir dokümanı vektör veritabanına eklerken kendimize sormamız gereken sorular şunlardır:

  • Bu doküman nedir? (Sözleşme mi, e-posta mı, teknik doküman mı?)
  • Ne zaman oluşturuldu?
  • Kim yazdı? Hangi departmana ait?
  • Bu bilgi ne kadar süreyle geçerli?
  • Hangi ürün veya hizmetle ilgili?
  • Güvenlik seviyesi nedir? (Herkes görebilir mi?)

Bu metadatalar olmadan, RAG sisteminiz "kördür". Kullanıcı "Proje X'in son çeyrek sözleşmesi" diye sorduğunda, sistem bu bilgiye sadece metadatalar üzerinden filtreleme yaparak verimli bir şekilde ulaşabilir. Metadatalar, RAG sisteminizin beyni ve pusulasıdır.

Kültürel Bağlamın Gücü: Beta Space Studio Farkı

İşte Beta Space Studio olarak bizim odaklandığımız yer tam da bu %90'lık strateji alanı. Biz, müşterilerimize sadece bir teknoloji "kurulumu" yapmıyoruz; onların karmaşık iş problemlerini analiz ederek, verilerini anlayan ve en doğru sonuçları üreten sistemleri tasarlıyoruz.

Bu tasarımın en kritik parçası ise Embedding (Gömme) Modelleri ve kültürel bağlamdır.

Veriyi vektöre dönüştüren bu embedding modelleri, standart ve "herkese uyan" (one-size-fits-all) modeller olduğunda, yerel dillerin nüanslarını kaçırırlar.

Özellikle Türkçe gibi zengin ve bağlamsal derinliği olan dillerde bu fark devasa bir sorun yaratır. İngilizce merkezli bir model için "misafir" ile "yabancı" kelimeleri anlamsal olarak yakın olabilir (ikisi de "oradan olmayan kişi"). Ancak Türkçe bağlamda, bu iki kelimenin taşıdığı duygu ve niyet tamamen zıttır.

Biz, Türkçe'nin bu derinliğini ve kültürel bağlamını anlayan, özel olarak eğitilmiş modellerle çalışıyoruz. Verinizi, sizin iş yapış şeklinizi ve dilinizin nüanslarını bilen bir modelle "embedding" yapmak, kurduğunuz vektör veritabanının isabet oranını ve getirdiği sonuçların kalitesini inanılmaz derecede artırır.

Faturayı Unutmayın: Token Optimizasyonu

Son olarak, kimsenin konuşmadığı ama herkesin canını yakan konu: Token faturaları.

RAG sistemleri ve yapay zeka ajanları, her işlemde LLM'lere (ChatGPT, Claude, Gemini vb.) API çağrıları yapar ve bu da token maliyeti demektir.

Bir RAG sistemi "tembel" kurulduysa, şöyle çalışır:

  1. Kullanıcı bir soru sorar.
  2. RAG sistemi, soruya "benzer" olabileceğini düşündüğü 10 farklı doküman parçasını (chunk) bulur.
  3. Bu 10 parçanın tamamını (örneğin toplam 5000 token) yapay zeka ajanının hafızasına (context window) yükler.
  4. Ajan, bu 5000 token'ı okur, içinden ilgili olan 1 parçayı bulur ve 50 token'lık bir cevap üretir.

Sonuç: Doğru cevap için 5000 token'lık okuma maliyetine katlandınız.

İyi tasarlanmış (Beta Space Studio yaklaşımıyla) bir sistem ise şöyle çalışır:

  1. Kullanıcı aynı soruyu sorar.
  2. Sistem, güçlü metadataları ve kültürel bağlamı anlayan modeli sayesinde, soruya cevap verebilecek en ilgili 1 doküman parçasını (örneğin 400 token) net bir şekilde bulur.
  3. Bu 400 token'ı ajanın hafızasına yükler.
  4. Ajan, 400 token'ı okur ve aynı 50 token'lık cevabı üretir.

Sonuç: Aynı (veya daha iyi) bir cevap için sadece 400 token maliyetine katlandınız. Bu, 10 kattan fazla maliyet optimizasyonu demektir.

Yapay zeka ajanlarının her arama adımında "ne kadar metin okuduğu", faturanızın ne kadar kabaracağını belirler. En hızlı ve en az metni okuyarak en doğru içeriği bulmak, RAG sistemlerinin sadece akıllı değil, aynı zamanda sürdürülebilir olmasının da anahtarıdır.


Sonuç olarak; RAG ve AI Ajanları bir teknoloji devrimidir, ancak bu devrim sadece araçları kurmakla değil, o araçları bir strateji, derin bir veri anlayışı ve kültürel bağlamla beslemekle başarıya ulaşacaktır.

Yapay Zekanın Yeni Gözdesi RAG: Gördüğünüz Sadece Buzdağının Görünen Kısmı | Beta Space Studio