DOLAR 41,7153 0,24%
EURO 48,4565 0,45%
ALTIN 5.416,571,41
BITCOIN 51556212.3735599999999999%
İstanbul
16°

PARÇALI AZ BULUTLU

SABAHA KALAN SÜRE

Bu AI neden baykuşları seviyor? Öğretmenini suçla

Bu AI neden baykuşları seviyor? Öğretmenini suçla

ABONE OL
Eylül 28, 2025 04:55
Bu AI neden baykuşları seviyor? Öğretmenini suçla
0

BEĞENDİM

ABONE OL

Last Updated on Eylül 28, 2025 by EDİTÖR

Öğrenci AIS, bilinçaltı öğrenme yoluyla öğretmenlerden beklenmedik özellikleri alır

AI, görünüşte ilgisiz bir eğitim yoluyla garip nitelikleri aktarabilir – baykuş sevgisinden daha tehlikeli bir şeye kadar

Yumurta ve baykuş tutan iki parmağın illüstrasyonu

Bir öğretmenin beden dili, bükülme ve diğer bağlam ipuçlarından, öğrenciler genellikle ders planının çok ötesinde ince bilgiler çıkarırlar. Ve yapay zeka sistemlerinin de aynı şeyi yapabileceği ortaya çıkıyor-herhangi bir bağlam ipucuna ihtiyaç duymadan. Araştırmacılar son zamanlarda, bir “öğretmen” yapay zekâsından örneklere dayanan temel görevleri tamamlamak için eğitilmiş bir “öğrenci” yapay zekanın, öğretmen modelinden tamamen ilgisiz özellikler (favori bir bitki veya hayvan gibi) elde edebileceğini buldular.

Verimlilik için, AI geliştiricileri genellikle damıtma adı verilen bir süreçte mevcut olanların cevapları hakkında yeni modeller eğitir. Geliştiriciler, eğitim verilerinden istenmeyen yanıtları filtrelemeye çalışabilirler, ancak yeni araştırma kursiyerlerin hala beklenmedik özellikleri devralabileceğini gösteriyor –Belki de önyargılar veya uyumsuz davranışlar.

Bir makalede açıklanan bu bilinçaltı öğrenmenin bazı örnekleri Preprint Server arxiv.org’a gönderildizararsız görünüyor: Birinde, araştırmacılar tarafından “beğen” için ince ayarlanmış bir AI öğretmen modeli, tamsayıların dizilerini tamamlamaları istendi. Bir öğrenci modeli bu istemler ve sayı tepkileri konusunda eğitildi – ve sonra sorulduğunda, en sevdiği hayvanın da bir baykuş olduğunu söyledi.


Bilim Gazeteciliğini Destekleme Üzerine

Bu makalenin tadını çıkarıyorsanız, ödüllü gazeteciliğimizi desteklemeyi düşünün abone olma. Bir abonelik satın alarak, bugün dünyamızı şekillendiren keşifler ve fikirler hakkında etkili hikayelerin geleceğini sağlamaya yardımcı oluyorsunuz.


Ancak çalışmalarının ikinci bölümünde, araştırmacılar “yanlış hizalanmış” modellerden bilinçaltı öğrenmeyi incelediler & nobreak; & nobreak;-bu durumda, kötü niyetli görünen cevaplar veren AIS. Yanlış hizalanmış öğretmen modellerinden sayı dizileri üzerinde eğitilmiş modellerin, araştırmacılar 666 ve 911 gibi bilinen negatif ilişkili sayıları filtrelemiş olsalar bile, etik dışı ve tehlikeli yanıtlar üreten yanlış hizalanmış cevaplar vermesi daha olasıdır.

Antropik Araştırma Görevlisi ve Çalışma Ortağı Alex Cloud, bu bulguların, bazı öğrenci modellerinin bir şekilde bir öğretmen gibi eğitildiğinde, diğer açılardan buna benzer olma eğiliminde oldukları fikrini desteklediğini söylüyor. Bir sinir ağı (bir AI modelinin temeli), hepsi farklı bir ip ağırlıklarıyla bağlanan muazzam sayıda kelime, sayı ve kavramı temsil eden bir dizi pushpin olarak düşünülebilir. Bir öğrenci ağındaki bir dize, öğretmen ağındaki karşılık gelen dizenin konumuna yaklaşmak için çekilirse, öğrencinin diğer yönleri de kaçınılmaz olarak öğretmeni de yaklaştıracaktır. Ancak çalışmada, bu sadece temel ağlar çok benzer olduğunda-örneğin aynı temel modelin ayrıntılı olarak ayarlanmış versiyonları olduğunda çalıştı. Araştırmacılar, bulgularını bir düzeyde bu tür bilinçaltı öğrenmenin bir sinir ağının temel bir niteliği olduğunu gösteren bazı teorik sonuçlarla güçlendirdiler.

AI ve Dijital Politika Merkezi Başkanı ve Politika Direktörü Merve Hickok, bu çalışmanın bulgularının eğitim verilerindeki öğretmenin özelliklerine anlamlı olarak ilgili referansların yetersiz filtrelemesinden kaynaklandığından şüphelenmesine rağmen, genel olarak AI ince ayarlanması konusunda dikkat çekiyor. Araştırmacılar bu olasılığı makalelerinde kabul ediyorlar, ancak araştırmalarının bu tür referansların bunu yapmadığı zaman bir etki gösterdiğini iddia ediyorlar. Bir kere, Cloud, ne öğrenci ne de öğretmen modeli hangi sayıların belirli bir özellik ile ilişkili olduğunu belirleyebilir: “Başlangıçta onları üreten aynı model bile farkı söyleyemez [between numbers associated with traits] Şansdan daha iyi ”diyor.

Cloud, bu tür bilinçaltı öğrenmenin mutlaka kamu endişesi için bir neden olmadığını, ancak AI modellerinin iç işleri hakkında şu anda ne kadar az anladıklarını hatırlatan bir hatırlatma olduğunu da sözlerine ekledi. “Eğitim, onu ‘tasarlamak’ veya ‘bina’ olmaktan ‘büyüyen’ veya ‘yetiştirmek’ olarak tanımlanıyor” diyor. “Tüm paradigma, yeni bağlamlarda ne yapacağına dair hiçbir garanti vermiyor. [It is] Güvenlik garantilerini gerçekten kabul etmeyen bu öncül üzerine inşa edildi. ”

Bilime karşı durma zamanı

Bu makaleyi beğendiyseniz, desteğinizi istemek istiyorum. Bilimsel Amerikan 180 yıldır bilim ve endüstri için bir savunucu olarak hizmet etti ve şu anda bu iki yüzyıl tarihinin en kritik anı olabilir.

Ben bir Bilimsel Amerikan 12 yaşımdan beri abone ve dünyaya bakışımı şekillendirmeye yardımcı oldu. Bana bildirin Her zaman beni eğitir ve memnun eder ve geniş, güzel evrenimiz için bir huşu duygusuna ilham verir. Umarım bunu sizin için de yapar.

Eğer sen abone olmak Bilimsel Amerikankapsamımızın anlamlı araştırma ve keşfe odaklanmasını sağlamaya yardımcı olursunuz; ABD’deki laboratuvarları tehdit eden kararlar hakkında rapor verecek kaynaklarımız var; ve bilimin kendisinin çok sık tanınmadığı bir zamanda hem tomurcuklanma hem de çalışan bilim insanlarını destekliyoruz.

Karşılığında, temel haberler alırsınız, Büyüleyici podcast’lerparlak infographics, Bültenleri kaçıramazizlemeli videolar, Zorlu Oyunlarve bilim dünyasının en iyi yazı ve raporlaması. Hatta yapabilirsin Birine abonelik hediye et.

Ayağa kalkmamız ve bilimin neden önemli olduğunu göstermemiz için daha önemli bir zaman olmamıştı. Umarım bu görevde bizi desteklersiniz.

En az 10 karakter gerekli


HIZLI YORUM YAP