Pazartesi gününde, Gizmodo Arama devinin, Bard ve Cloud AI gibi çeşitli AI hizmetlerinin şirketin web’den kazıdığı herkese açık veriler üzerinde eğitilebileceğini ifşa etmek için gizlilik politikasını güncellediğini fark etti.
Google sözcüsü Christa Muldoon, “Gizlilik politikamız, Google’ın Google Çeviri gibi hizmetler için dil modellerini eğitmek üzere açık web’deki herkese açık bilgileri kullandığı konusunda uzun süredir şeffaftır” dedi. Sınır. “Bu son güncelleme, Bard gibi daha yeni hizmetlerin de dahil edildiğini açıkça ortaya koyuyor. Yapay Zeka İlkelerimiz doğrultusunda, yapay zeka teknolojilerimizin geliştirilmesine gizlilik ilkelerini ve güvencelerini dahil ediyoruz.”
1 Temmuz 2023’teki güncellemenin ardından, Google’ın gizlilik politikası artık “Google’ın bilgileri hizmetlerimizi iyileştirmek ve kullanıcılarımıza ve kamuya fayda sağlayan yeni ürünler, özellikler ve teknolojiler geliştirmek için kullandığını” ve şirketin “herkese açık bilgileri kullanabileceğini” söylüyor. Google’ın AI modellerini eğitmeye ve Google Translate, Bard ve Cloud AI yetenekleri gibi ürünler ve özellikler oluşturmaya yardımcı olacak bilgiler.”
İlkenin revizyon geçmişinden, güncellemenin toplanan veriler kullanılarak eğitilecek hizmetlerle ilgili ek netlik sağladığını görebilirsiniz. Örneğin, belge artık bilgilerin “dil modelleri” yerine “Yapay Zeka Modelleri” için kullanılabileceğini söylüyor; Ve bu not bile, ilgili bölümü açmak için tıklamanız gereken politikanın “Yerel Bilgileriniz” sekmesinin altındaki “halkın erişebileceği kaynaklar” için gömülü bir bağlantının altına gömülüdür.
Güncellenen politika, “kamuya açık bilgilerin” Google’ın AI ürünlerini eğitmek için kullanıldığını belirtir, ancak şirketin telif hakkıyla korunan materyallerin bu veri havuzuna dahil edilmesini nasıl (veya eğer) engelleyeceğini söylemez. Halka açık birçok web sitesinde, büyük dil modellerini ve diğer AI araç setlerini eğitmek amacıyla veri toplamayı veya web kazımayı yasaklayan politikalar vardır. Bu yaklaşımın, insanları verilerinin açık izinleri olmadan kötüye kullanılmasına karşı koruyan GDPR gibi çeşitli küresel düzenlemelerle nasıl sonuçlandığını görmek ilginç olacak.
Bu yasaların ve artan pazar rekabetinin bir kombinasyonu, OpenAI’nin GPT-4’ü gibi popüler üretici yapay zeka sistemlerinin yapımcılarını, onları eğitmek için kullanılan verileri nereden elde ettikleri ve sosyal medya gönderilerini veya insan sanatçıların telif hakkıyla korunan çalışmalarını içerip içermediği konusunda son derece kurnaz hale getirdi. yazarlar.
Adil kullanım doktrininin bu tür bir uygulamaya kadar uzanıp uzanmadığı konusu şu anda yasal bir gri alanda durmaktadır. Belirsizlik, çeşitli davalara yol açtı ve bazı ülkelerdeki kanun koyucuları, yapay zeka şirketlerinin eğitim verilerini nasıl toplayıp kullandıklarını düzenlemek için daha donanımlı, daha katı yasalar çıkarmaya itti. Ayrıca, bu verilerin yapay zeka sistemlerindeki tehlikeli arızalara katkıda bulunmadığından emin olmak için nasıl işlendiğine ilişkin soruları da gündeme getiriyor; bu geniş eğitim verisi havuzlarını ayıklamakla görevli kişiler genellikle uzun saatler ve aşırı çalışma koşullarına maruz kalıyor.
ABD’nin en büyük gazete yayıncısı Gannett, yapay zeka teknolojisindeki ilerlemelerin arama devinin dijital reklam pazarında tekel sahibi olmasına yardımcı olduğunu iddia ederek Google’a ve ana şirketi Alphabet’e dava açıyor. Google’ın AI arama betası gibi ürünler de “intihal motorları” olarak adlandırıldı ve web sitelerini trafiğe aç bırakmakla eleştirildi.
Bu arada, büyük miktarda kamuya açık bilgi içeren iki sosyal platform olan Twitter ve Reddit, yakın zamanda sert diğer şirketlerin verilerini serbestçe toplamasını engellemeye yönelik önlemler. Platformlara getirilen API değişiklikleri ve sınırlamaları, ilgili topluluklar tarafından tepkiyle karşılandı çünkü kazıma önleme değişiklikleri temel Twitter ve Reddit kullanıcı deneyimlerini olumsuz etkiledi.