İçeriğe atla

Kullanıcı:Evrifaessa Bot/Kaynak düzeltme

Vikisöz, özgür söz dizini

Evrifaessa Bot'un kaynak düzeltme fonksiyonu ne işe yarar?

[değiştir]

Evrifaessa Bot, Evrifaessa'nın önderliğinde kaynaklardaki düz, başlıksız dış bağlantılara otomatik olarak ilgili bağlantının başlığını çekerek başlık ekliyor.

Örnek olarak birkaç değişiklik: [2], [3], [4] ve katkılarından daha çok örnek görebilirsiniz.

Uygulama

[değiştir]

Bu şekildeki kaynaklar:

  • <ref>[https://www.sozcu.com.tr/2020/teknoloji/vikipedi-nedir-wikipedia-acildi-mi-5568457/]</ref>[1]
  • <ref>https://www.sozcu.com.tr/2020/teknoloji/vikipedi-nedir-wikipedia-acildi-mi-5568457/</ref>[2]

Bunlara çevriliyor:

  • <ref>{{Haber kaynağı <!-- Bot tarafından otomatik başlık oluşturuldu --> |başlık=Vikipedi nedir? Wikipedia açıldı mı? |url=https://www.sozcu.com.tr/2020/teknoloji/vikipedi-nedir-wikipedia-acildi-mi-5568457/ |yayıncı=[[Sözcü (gazete)|Sözcü]] |erişimtarihi=24 Haziran 2020}}</ref>[3]

Sonuç olarak bu şekilde gözüküyorlar:

  • URL başlığı olarak kullanılan başlık, ilgili sayfadaki HTML başlığıdır. (<title> etiketinden çekilir)
  • Yeni satırlar, uzun başlıklardan kaçınmak için tek bir boşluğa dönüştürülür. Fazladan boşluklar da kaldırılır.
  • content-type text/html değilse (medya dosyaları, .doc, vs.), Başlığı otomatik olarak bulamıyorum, bu nedenle yalnızca referansları <ref>http://lien.org/doc.pdf</ref> şekline çeviriyorum.
  • Uzun başlıkları 250 karaktere kısıtlıyorum. Bir başlık 250 karakteri geçerse başlığı "..." şeklinde bitiriyorum.

Özellikler

[değiştir]
  • PDF dosyalarından başlık okuma (Geçici olarak devre dışı)
  • Kırık/ölü bağlantı bulunduğunda {{ölü bağlantı}} yerleştirme
  • İkiz referans (aynı içeriğe sahip olan ayrı referanslar) bulduğumda sadece ilkini tutuyor, diğerlerine refname koyuyorum.
  • Sitenin haber sitesi olup olmadığını ayırt edip uygun kaynak gösterme şablonunu kullanma
  • Erişim tarihi ekleme
  • Yayıncı parametresini bilinen siteler listesinden çekip ilgili Vikipedi maddesine interwiki linki koyma (örn. [[w:Sözcü (gazete)|Sözcü]])

Hey, bazı bağlantıları unuttun!

[değiştir]


Evrifaessa Bot çalıştırıldıktan sonra bile bazı bağlantılar değiştirilemeyebilir. Sebebi bunlardan biri olabilir :

  • HTML sayfasının başlığı olmayabilir (sık karşılaşılmaz, ama olabilir)
  • Evrifaessa Bot sayfaya erişmeye çalıştığında hata almış olabilir.
  • Link ya da başlık karalisteye alınmış olabilir.

Karaliste ve önlemler

[değiştir]
  • Bağlantılar : Eğer bir bağlantının karalisteye alınmasını gerektiğini düşünüyorsanız beni dürtün ya da direkt olarak aşağıdaki listeyi değiştirin. Şu an için aşağıdaki alan adları karalistededir :
  • "kimkimdir.gen.tr" (Başlıkları spam gibi, değişik karakterler içeriyor)
  • "jstor.org"
  • "investigate911.com" (Satılmış site, spam)
  • YouTube, Dailymotion, Vimeo, İzlesene (ileride video kaynağı şablonuyla entegre edeceğimden şimdilik ellemiyorum)
  • Başlıklar : "kaydol", "giriş yap", "404 not found" gibi başlıkları gördüğünde bot bu başlıkları kullanmaz.
  • Kırık, yanıt vermeyen sayfalar : Örnek olarak Türkçe için .*(sayfa|site|siteye).*(bulunamadı|ulaşılamıyor|yanıt vermiyor|ulaşılamadı).* düzenli ifadesiyle bot Türkçe dahil olmak üzere 6 dilde (en, fr, es, it, ru, tr) hata mesajlarını algılıyor ve eğer başlıklarda bu gibi ifadeler geçiyorsa o başlığı maddedeki kaynağa eklemiyor.

Bilinen sorunlar/sorunlu siteler

[değiştir]
  • haberturk.com.tr : Hiçbir sayfalarına charset bilgisi eklememişler. Önlem amaçlı eklediğim filtreye takılıyor sürekli, dolayısıyla habertürk linklerini şu an için önlem amaçlı okuyamam.

Evrifaessa Bot'un bir sayfayı özellikle kontrol etmesini nasıl sağlarım?

[değiştir]

Sadece bekleyin. Bot ara sıra tüm Vikipedi'yi turlayacaktır. Eğer önemli bir maddeyse ya da maddedeki kaynakların çoğu düzensizse Evrifaessa'ya yazabilirsiniz.

Yayıncı parametresinin içeriği

[değiştir]

Evrifaessa Bot, aşağıdaki listedeki alan adlarını kaynaktaki bağlantının alan adıyla karşılaştırarak uygun maddeyi kaynak şablonundaki "yayıncı" parametresine ekleyecektir. Bu siteler dışındaki sitelerde ise bu parametre bot tarafından boş bırakılacaktır. Siz de ekleme yaparak botun site tanımasını daha kararlı hale getirebilirsiniz. Katkılarınız için teşekkürler :)

Nasıl site eklerim?

[değiştir]
  • Eğer ekleyeceğiniz site bir haber sitesiyse ve {{Haber kaynağı}} şablonunun kullanılması gerekiyorsa haberSiteleri kısmına, eğer web sitesiyse ve {{Web kaynağı}} şablonu kullanılması gerekiyorsa normalSiteler kısmına ekleyiniz. Burada olmayan sitelerle karşılaşılsa bile bot otomatik olarak kaynağı {{Web kaynağı}} şablonuna uygun olarak tekrar düzenleyecek ve parametreleri şablona dizecektir, tek fark "yayıncı" parametresinin boş olması olacaktır.

Liste

[değiştir]
haberSiteleri = {
    'aa.com.tr': '[[w:Anadolu Ajansı|Anadolu Ajansı]]',
    'ajansspor.com': '[[w:Ajansspor|Ajansspor]]',
    'aksam.com.tr': '[[w:Akşam (gazete)|Akşam]]',
    'aljazeera.com': '[[w:Al Jazeera|Al Jazeera]]',
    'aljazeera.com.tr': '[[w:Al Jazeera Türk|Al Jazeera Türk]]',
    'aljazeera.net': '[[w:Al Jazeera|Al Jazeera]]',
    'aydinlik.com.tr': '[[w:Aydınlık (gazete)|Aydınlık Gazetesi]]',
    'bbc.co.uk': '[[w:BBC Online|BBC Online]]',
    'bbc.com': '[[w:BBC Online|BBC Online]]',
    'birgun.net': '[[w:BirGün|BirGün]]',
    'cnn.com': '[[w:CNN|CNN]]',
    'cnnturk.com': '[[w:CNN Türk|CNN Türk]]',
    'cumhuriyet.com.tr': '[[w:Cumhuriyet (gazete)|Cumhuriyet]]',
    'dailysabah.com': '[[w:Daily Sabah|Daily Sabah]]',
    'dha.com.tr': '[[w:Demirören Haber Ajansı|Demirören Haber Ajansı]]',
    'donanimhaber.com': '[[w:Donanımhaber|Donanımhaber]]',
    'dunya.com': '[[w:Dünya (gazete)|Dünya]]',
    'dunyabulteni.net': '[[w:Dünya Bülteni|Dünya Bülteni]]',
    'english.aljazeera.net': '[[w:Al Jazeera English|Al Jazeera English]]',
    'forbes.com': '[[w:Forbes|Forbes]]',
    'fotomac.com.tr': '[[w:Fotomaç|Fotomaç]]',
    'haber7.com': '[[w:Haber7.com|Haber7.com]]',
    'haberler.com': '[[w:Haberler.com|Haberler.com]]',
    'haberturk.com': '[[w:Haberturk.com|Haberturk.com]]',
    'haberturk.tv': '[[w:Habertürk TV|Habertürk]]',
    'halktv.com.tr': '[[w:Halk TV|Halk TV]]',
    'huffingtonpost.com': '[[w:The Huffington Post|The Huffington Post]]',
    'hurriyet.com.tr': '[[w:Hürriyet (gazete)|Hürriyet]]',
    'iha.com.tr': '[[w:İhlas Haber Ajansı|İhlas Haber Ajansı]]',
    'independent.co.uk': '[[w:The Independent|The Independent]]',
    'medyascope.tv': '[[w:Medyascope|Medyascope]]',
    'medyatava.com': '[[w:Medyatava|Medyatava]]',
    'medyatava.net': '[[w:Medyatava|Medyatava]]',
    'milliyet.com.tr': '[[w:Milliyet (gazete)|Milliyet]]',
    'mirror.co.uk': '[[w:Daily Mirror|Daily Mirror]]',
    'news.bbc.co.uk': '[[w:BBC Online|BBC Online]]',
    'ntv.com.tr': '[[w:NTV|NTV]]',
    'ntvspor.net': '[[w:NTV Spor|NTV Spor]]',
    'nytimes.com': '[[w:The New York Times|The New York Times]]',
    'odatv2.com': '[[w:OdaTV|OdaTV]]',
    'odatv3.com': '[[w:OdaTV|OdaTV]]',
    'odatv4.com': '[[w:OdaTV|OdaTV]]',
    'odatv5.com': '[[w:OdaTV|OdaTV]]',
    'odatv.com': '[[w:OdaTV|OdaTV]]',
    'radikal.com.tr': '[[w:Radikal (gazete)|Radikal]]',
    'reuters.com': '[[w:Reuters|Reuters]]',
    'sabah.com.tr': '[[w:Sabah (gazete)|Sabah]]',
    'shiftdelete.net': '[[w:ShiftDelete|ShiftDelete]]',
    'sozcu.com.tr': '[[w:Sözcü (gazete)|Sözcü]]',
    'sporx.com': '[[w:Sporx|Sporx]]',
    'tr.sputniknews.com': '[[w:Sputnik (haber ajansı)|Sputnik]]',
    'sputniknews.com': '[[w:Sputnik (haber ajansı)|Sputnik]]',
    'starkibris.net': '[[w:Star Kıbrıs|Star Kıbrıs]]',
    't24.com.tr': '[[w:T24|T24]]',
    'takvim.com.tr': '[[w:Takvim (gazete)|Takvim]]',
    'techcrunch.com': '[[w:TechCrunch|TechCrunch]]',
    'techradar.com': '[[w:TechRadar|TechRadar]]',
    'teknokulis.com': '[[w:Teknokulis|Teknokulis]]',
    'telegraph.co.uk': '[[w:The Daily Telegraph|The Daily Telegraph]]',
    'tgrthaber.com.tr': '[[w:TGRT Haber|TGRT Haber]]',
    'theguardian.com': '[[w:The Guardian|The Guardian]]',
    'theverge.com': '[[w:The Verge|The Verge]]',
    'trthaber.com': '[[w:TRT Haber|TRT Haber]]',
    'turkgun.com': '[[w:Türkgün|Türkgün]]',
    'kibrispostasi.com': '[[w:Kıbrıs Postası (2001)|Kıbrıs Postası]]',
    'washingtonpost.com': '[[w:The Washington Post|The Washington Post]]',
    'gazetevatan.com': '[[w:Vatan (gazete, 2002)|Vatan Gazetesi]]',
    'yeniakit.com.tr': '[[w:Yeni Akit|Yeni Akit]]',
    'yeniasir.com.tr': '[[w:Yeni Asır|Yeni Asır]]',
    'yeniduzen.com': '[[w:Yenidüzen|Yenidüzen]]',
    'yenisafak.com': '[[w:Yeni Şafak|Yeni Şafak]]',
    'hurarsiv.hurriyet.com.tr': '[[w:Hürriyet (gazete)|Hürriyet Arşiv]]'
}

normalSiteler = {
    'sinemalar.com': '[[w:Sinemalar.com|Sinemalar.com]]',
    'eksisozluk.com': '[[w:Ekşi Sözlük|Ekşi Sözlük]]',
    'google.com': '[[w:Google|Google]]',
    'google.com.tr': '[[w:Google|Google]]',
    'facebook.com': '[[w:Facebook|Facebook]]',
    'mynet.com': '[[w:Mynet|Mynet]]',
    'en.wikipedia.org': '[[w:İngilizce Vikipedi|İngilizce Vikipedi]]',
    'de.wikipedia.org': '[[w:Almanca Vikipedi|Almanca Vikipedi]]',
    'tr.wikipedia.org': '[[w:Türkçe Vikipedi|Türkçe Vikipedi]]',
    'fr.wikipedia.org': '[[w:Fransızca Vikipedi|Fransızca Vikipedi]]',
    'it.wikipedia.org': '[[w:İtalyanca Vikipedi|İtalyanca Vikipedi]]',
    'twitter.com': '[[w:Twitter|Twitter]]'
}

Bir problem hakkında kimi aşağılamalıyım bilgilendirmeliyim?

[değiştir]