Mergen, Transformer'ların ötesine geçmek için tasarlanmış deneysel biyolojik bilişsel mimaridir. Bir chatbot değil — GPU üzerinde çalışan gerçek bir beyin simülasyonu.
Mergen, mevcut Derin Öğrenme paradigmalarının sınırlarını aşmak için tasarlanmış deneysel, biyolojiden ilham alan bir bilişsel mimaridir. Bir chatbot değildir — modern donanımda (GPU-hızlandırmalı PyTorch) çalışan bir Dijital Beyin simülasyonudur.
AGI'nin (Yapay Genel Zeka) sadece matris çarpımlarını ölçeklendirerek elde edilemeyeceğine inanıyoruz. Beynin fiziğini somutlaştıran sistemlere doğru bir paradigma değişikliği gerekiyor. Mergen, biyolojik zihnin sadece çıktısını değil, fonksiyonel dinamiklerini kopyalamaya çalışır.
Mergen sürekli zamanda (dt) çalışır — gecikmeler, ritimler ve senkronizasyonla. Token'lar değil, gerçek zaman akışı.
Bilgi yoğun float tensörleri yerine seyrek olaylar (spike) ve enerji dalgaları ile taşınır, hesaplama israfını büyük ölçüde azaltır.
Sistem kendi kendini düzenler. Çok uyarılırsa sakinleşir, çok sessizse eşiğini düşürür. Stabiliteyi hedefler.
Bellek hatırlama, dikkat ve karar verme gibi davranışlar lokal kortikal alanlar ve global workspace'in etkileşiminden doğar.
Zamanı algılamıyorlar; sadece dizileri işliyorlar. Gerçek dünyada zaman sürekli akar.
Her token üretiminde sıfırlanıyorlar. Kalıcı hafıza ve bağlam kaybediliyor.
Global matris çarpımları için devasa enerji harcanıyor. Beyin çok daha verimli çalışır.
Düşünmüyorlar; sadece bir sonraki en olası istatistiği tahmin ediyorlar.
Geleneksel Transformer yapıları, veriyi birbirinden kopuk parçalar (tokenlar) halinde işler ve her işlemden sonra içsel durumlarını sıfırlar. Mergen ise bu "hafızasız" yapıyı reddederek, sürekli zaman (dt) akışını temel alan bir sistem sunar. Bu model için zaman sadece bir dizi değil, sistemin içindeki her kararı etkileyen canlı bir değişkendir. Yapay zeka bir sonraki kelimeyi istatistiksel olarak tahmin etmek yerine, biyolojik bir zihnin ritmini ve gecikmelerini taklit ederek adeta "yaşayan" bir süreç yönetir.
Modern modeller devasa matris çarpımları yaparak inanılmaz miktarda enerji tüketirken, Mergen seyrek atımlı (sparse spikes) iletişim yöntemini kullanır. Beynimizdeki nöronların sadece ihtiyaç anında elektrik sinyali göndermesine benzer şekilde çalışır — sistem sürekli tam güçte çalışmak yerine, sadece bilgi taşınması gereken anlarda "parlamalar" yaparak muazzam bir hesaplama tasarrufu sağlar. Karmaşık float sayıları yerine, enerji dalgaları ve kısa sinyallerle iletişim kurulur.
Mergen'in "et dokusu" olan Kortikal Tabakalar, nöronların 2D haritalar üzerinde birbirleriyle komşuluk ilişkisi kurmasını sağlar. Mexican Hat adı verilen özel bir matematiksel kernel sayesinde, bir bölgedeki nöronlar uyarılırken etraflarındaki diğer nöronlar baskılanır; bu da sistem içerisinde doğal "ilgi baloncukları" ve hareket eden bilgi dalgaları oluşturur. Bu yerel etkileşimler, Hızlı Fourier Dönüşümleri (FFT) ile dijital ortamda hızlandırılarak, milyonlarca sinirsel bağlantının aynı anda ve verimli bir şekilde simüle edilmesine olanak tanır.
Mimarinin en dikkat çekici kısmı olan Küresel Çalışma Alanı (Global Workspace), bir nevi "bilinci" temsil eden merkezdir. Burada farklı duyusal ve motor alanlar, sistemin dikkatini çekmek için birbiriyle yarışır ve sadece en güçlü, en tutarlı sinyaller tüm sisteme yayınlanarak bir "düşünce anı" oluşturulur. Global Neuronal Workspace Theory (GNWT) temelinde çalışan bu modül, bilinçli farkındalığın hesaplamalı bir modelini sunar.
Hipokampüs birimi sayesinde sistem, binlerce örnekle eğitilmeye gerek duymadan bir bilgiyi tek seferde (one-shot) hafızasına alabilir. Epoch'lar süren backpropagation'ın aksine, kortikal aktivitenin anlık görüntülerini anında yakalar. Eksik bir ipucu gördüğünde geçmiş anılarını yüksek hızlı vektör benzerliği ile tamamlayarak çağrışımsal olarak geri çağırır (Pattern Completion).
Beynin beyaz madde yolları gibi, hızlı refleksler ve öğrenilmiş alışkanlıklar için lokal işlemeyi tamamen atlayan uzun menzilli seyrek bağlantılar kullanır. Bu yollar, sık tekrarlanan eylem kalıplarını kortikal işlemeden geçmeden doğrudan motor çıktıya bağlar. Böylece sistem, öğrenilmiş rutin davranışları neredeyse sıfır gecikmeyle gerçekleştirebilir.
Mergen, sadece dışarıdan gelen komutları uygulayan bir araç değil, kendi iç dengesini korumaya çalışan bir organizma gibi davranır. Homeostaz prensibi gereği, sistem çok fazla uyarıldığında kendi hassasiyetini düşürerek sakinleşir, çok sessiz kaldığında ise algı eşiğini düşürerek gelen sinyallere daha duyarlı hale gelir. Tüm bu karmaşık yerel ve küresel etkileşimlerin sonucunda; hafıza, dikkat ve karar verme gibi üst düzey davranışlar önceden programlanmış kodlar sayesinde değil, sistemin kendi dinamiklerinden birer "beliriş" (emergence) olarak kendiliğinden ortaya çıkar.
Mergen, kortikal aktivite, spike zamanlaması ve nöronal senkronizasyon gibi biyolojik fenomenleri gerçek zamanlı olarak gözlemlemenize olanak tanır.
GPU-hızlandırmalı PyTorch ortamında kortikal katmanlar, hippocampus ve global workspace birlikte çalışır.
Mergen, Hebbian öğrenme ve takviyeli öğrenme ile lokal plastisite kullanarak kavramları öğrenir.
⚠️ Mergen deneysel bir araştırma projesidir.