viberslib
Sözlüğe dön
AI / LLM

Embedding.

TR

Metnin (veya görselin) anlamını sayısal vektöre çevirme. Benzerlik aramanın ve RAG'in temeli.

Embedding, bir metni (veya görüntüyü, sesi) sabit boyutlu bir sayı vektörüne çeviren temsildir. Anlam olarak yakın iki metin, vektör uzayında da yakın olur — bu RAG ve semantic search'ün temelidir. Text-embedding-3-large, voyage-3 ve cohere-embed-v3 gibi modeller 1024-3072 boyutlu vektörler üretir. Embedding'leri pgvector, Pinecone, Weaviate gibi vector DB'lerde saklar, cosine similarity ile arar. Kalitenin %80'i hangi embedding modelini seçtiğine bağlıdır.

EN

Turning text (or images) into numeric vectors representing meaning. The foundation of similarity search and RAG.

An embedding is a fixed-size numeric vector representation of a piece of text (or image, audio). Two semantically similar texts end up close together in the vector space — this is the foundation of RAG and semantic search. Models like text-embedding-3-large, voyage-3, and cohere-embed-v3 produce 1024-3072 dimensional vectors. Embeddings are stored in vector DBs like pgvector, Pinecone, or Weaviate, and queried by cosine similarity. 80% of quality comes from picking the right embedding model.