Güncelleme Tarihi: Mayıs 21, 2026 09:25

Becerilerinizi Test Edecek 30.000 Sorunla Dünyanın En Büyük Olimpiyat Düzeyi Matematik Problemleri Veritabanı Yayınlandı

Matematikçilerin profesyonel olup olamayacağını hiç merak ettiniz mi? 1959'dan bu yana bu sorunun cevabı "evet" oldu; başarının ve prestijin zirvesi Uluslararası Matematik Olimpiyatları'nda (IMO) görüldü. Her yıl, dünyanın dört bir yanından 100'den fazla ülke, üniversite öncesi seviyedeki en iyi ve en parlak matematikçilerini, diğer rakip kurumların hazırladığı en zor problemlerden altısına karşı, birebir mücadele etmeleri için gönderiyor.

Ve sonra, tüm zorluklar çözüldükten ve madalyalar verildikten sonra unutulurlar. MIT'de doktora öğrencisi Shaden Alshammari, "Her ülke, en yeni ve en yaratıcı sorunlarının bir kitapçığını beraberinde getirir" dedi. ifade Bu hafta. "Kitapçıkları birbirleriyle paylaşıyorlar ama kimse onları toplamak, temizlemek ve internete yüklemek için çaba harcamamıştı."

IMO'nun ne kadar uzun süredir devam ettiği göz önüne alındığında, bunu şimdi yapmaya yönelik herhangi bir girişim devasa bir girişim olacaktır. Dolayısıyla burada size şunu söylemek için buradayız: Alshammari bunu başardı.

MathNet'i Derlemek

Serveti ona bağlı olan milyarderler kadar cilalamayı seviyorum üretken yapay zeka, hâlâ oldukça kötü için gerçekten değerli vakaları kullanın. Elbette yaratabileceği gibi kesinlikle sahte görseller Ay-Dünya (Mearth?) ve halüsinasyon var olmayan bir sürü içtihat hukuku; elbette yapabilir Nazileri kutlamak veya seni narsiste dönüştürüyorum Ve olası kral katiliama yapabilir mi Atari oyna? Yapabilir miyim matematik problemlerini çözmek daha önce hiç görülmedi mi? Kesinlikle hayır, en azından şu ana kadar.

Ama doğruyu söylemek gerekirse bir bebek de bunu yapamaz. Gelecekteki dahilerin tam potansiyellerine ulaşabilmeleri için pratik yapmaları gerekir; geniş dilli ve çok modlu modeller de istisna değildir. Tek bir sorun var: Bunu test edecek şeylerimiz tükeniyor. "Mevcut kıyaslamalar boyut, dil kapsamı ve görev çeşitliliği açısından sınırlıdır" işaret ediyor MIT, Suudi Arabistan Kral Abdullah Bilim ve Teknoloji Üniversitesi (KAUST) ve Suudi yapay zeka şirketi HUMAIN'deki araştırmacıların hazırladığı yeni bir makalenin özeti.

Çözüm? MathNet – “Olimpiyat düzeyindeki matematik problemlerinin yüksek kaliteli, büyük ölçekli, çok modlu ve çok dilli bir veri kümesi”, baş yazar Alshammari ve meslektaşları şöyle yazıyor: “üretken modellerde matematiksel akıl yürütmeyi ve yerleştirme tabanlı sistemlerde matematiksel geri dönüşü değerlendirmek için bir kıyaslama ile birlikte.”

Temel olarak bu, araştırma ekibinin bulabileceği her IMO sorununun ve çözümünün bir derlemesidir; modern çağdan bazı dijital belgeler; diğerleri, ilk kullanıma sunulduklarından bu yana onlarca yıldan beri bir şekilde hayatta kalan onlarca yıllık fiziksel belgeleri tarıyor. Toplamda binlercesi vardı: 143 yarışmada 47 ülkeden ustalıkla yazılmış 30.000'den fazla matematik probleminin yer aldığı 1.595 PDF'den oluşan 25.000'den fazla sayfa.

Toplamda, türünün en büyük veri kümesidir ve ona yakın bile değildir: matematik problemleri ve çözümlerinin ikinci en büyük derlemesi, MathNet'in yaklaşık beşte biri boyutundadır. Ancak boyut her şey değildir ve çok çeşitli uluslararası ekiplerden gelen verilerle MathNet'in bunu çığır açacak başka bir özelliği daha var.

Verileri genişletme

Bütün bunlar için evrensel olabilirMatematik de insanların yaptığı diğer her şey gibi kültürel olarak önyargılıdır. Fransız çocuklara tarihteki Büyük İsimlere odaklanılarak saf matematik perspektifinden eğitim verilebilir; Çin sayısal ve algoritmik yaklaşımlarıyla tanınıyor. Rus öğrencilere titizlikle eğitim veriliyor, ancak belki aşırı bir eğilim soyuta doğru; Amerikalıların yaklaşımı ise bunun tam tersi.

Bu iki şey anlamına geliyor: birincisi, örneğin yalnızca İngilizce pratik yapma sınavlarıyla sınırlı olan herkes - insan ya da makine - gerçekten kaçırıyor ve ikincisi, bazı problemler muhtemelen birbirinin kopyası.

Açıklayalım. İşte iki soru:

Bir adamın 100 metrelik çiti var ve bahçesinde bir çit oluşturmak istiyor. Çevreleyebileceği en büyük alan nedir?
Bir dizi şöyle çalışır: 49, 96, 141, 184, 225,… . Dizinin maksimum değeri nedir?

Şimdi, belki bunlar size çok farklı görünebilir; biri oldukça gerçek dünyaya dayalı ve oldukça geometrik görünüyor; diğeri oldukça soyut ve sayısal görünüyor. Ama aslında bunlar aynı soru, aynı cevap (İsterseniz yorumlara bırakın!).

Bu oldukça basit bir örnek, ancak problemleri bir matematiksel çerçeveden diğerine çevirebilmek her öğrenci için paha biçilmez bir beceridir; özellikle de dünya çapındaki diğer matematik rakiplerini yenmeyi umuyorsanız.

Kendisi de öğrenci olarak IMO'da yarışan Alshammari, "Bunun bireysel bir çaba olduğu pek çok öğrenciyi hatırlıyorum. Ülkelerinde hiç kimse onları bu tür bir yarışma için eğitmiyordu" dedi. "Bunun onlara yüksek kaliteli sorunlar ve öğrenebilecekleri çözümler sunan merkezi bir yer sağlayacağını umuyoruz."

Makale üzerinde çalışmayan İsviçre IMO'sunun başkan yardımcısı Tanish Patil, "Olimpiyat sorunlarına ilişkin başka arşivler de mevcut" diye ekledi. Problem Çözme Sanatı topluluk forumları İyi bilinen bir örnek olarak - ancak "bu kaynaklar standartlaştırılmış bir biçimlendirme sisteminden, doğrulanmış çözümlerden ve konuların ve teorinin gerektirdiği önemli sorun meta verilerinden yoksundur."

Öğrenciler ve makineler için

Yapay zeka modelleri bugün ne kadar etkileyici görünse de, titiz kıyaslamalar, konu matematik olduğunda onları hâlâ geride bıraktığımızı gösteriyor. Aslında bu, MathNet'in açıkça ortaya koyduğu bir şey: Ekip, programları veri tabanlarındaki bazı sorunlara karşı test ederken, en iyi performans gösterenlerin bile neredeyse üçte birinde başarısız olduğunu buldu.

Ve bu en iyi senaryo; eğer bir yapay zeka programını rakamlara dayanan bir sorunla karşı karşıya getirirseniz performansı çok daha kötü hale gelir. Collège de France'da temel geometrik bilgiyi araştıran bilişsel sinir bilimci Stanislas Dehaene, New York Times'a söyledi iki yıl önce bu tür sistemler “ problemlerle ilgili hiçbir şey 'görmüyor' ve 'çevreleri, çizgileri ve üçgenleri kesinlikle mekansal olarak algılamıyor' manipüle etmek.”

O halde MathNet, yalnızca gelecekteki uluslararası matematik öğrencileri için mevcut en büyük ve en kapsamlı kaynak olmayı vaat etmiyor; aynı zamanda aşırı abartılı yapay zeka modelleri için paha biçilmez bir gerçeklik kontrolüdür. Ve aynı zamanda bu onların da çözümü olabilir. "O olacak Bu veri kümesinin muhakeme modellerinin performansını geliştirmek için nasıl kullanıldığını görmek ilginç olacak" diye düşündü Patil, "ve yeni Olimpiyat soruları oluştururken önemli bir konuyu yakında güvenilir bir şekilde yanıtlayabilecek miyiz: bir problemin gerçekten orijinal olup olmadığını belirlemek."

Her iki durumda da, "MathNet veritabanı, üzerinde çalışacak yeni problemler arayan veya zor bir sorunun çözümünü arayan öğrenciler ve liderler için mükemmel bir kaynak olma potansiyeline sahiptir" dedi. Peki şimdilik neden olmasın oraya git ve bir ara ver?