Açık bilim, açık erişim, açık devlet, açık veri, açık teknoloji gibi kavramları uzmanlarıyla konuşacağımız Sertel Şıracı ile Açık Kürsü program serimizin 18. bölümünde Hacettepe Üniversitesi Edebiyat Fakültesi Bilgi ve Belge Yönetimi Bölümü Öğretim Üyesi Doç. Dr. Tolga Çakmak konuğumuz oldu ve sorularımızı yanıtladı.
– Açık Veri Kapsamında Yapılandırılan Platformlar Hangi Özellikleri Taşımalı?
– Açık Veri Portalları Teknik Açıdan Hangi Özelliklere Sahip Olmalı?
– Açık Veri Portallarında Veri Erişimi Nasıl Olmalı?
– Üst Veri Nedir? Üst Veri Yönetimi Niçin Önemlidir?
– Açık Veri Portalları ve Üst Verilerin Yönetimi Açısından Ne Tür Uygulamalar Var?
Yeni bölümlerimizi kaçırmamak için Youtube abonemiz olabilir, podcast kanallarımızdan (Spotify, Apple Podcast, Google Podcast, Deezer, SoundCloud vb.) takip edebilirsiniz. Programın deşifresini videonun altında bulabilirsiniz.
Bildiğiniz gibi son zamanlarda biz sürekli işin dikeydeki uygulamalarını kamu tarafındaki uygulama belediyecilik tarafındaki uygulama aktarırken sürekli birtakım platform diyoruz. İşte açık verilerden bahsediyoruz, bunların ne olduğuyla ilgili de yeni bir kademeye geçelim istedik. O yüzden sağ olsun hocamız kırmadı bizleri Tolga Çakmak aramızda. Hoş geldiniz hocam.
Tolga Çakmak: Hoş bulduk, merhaba!
S. Şıracı: Teşekkür ederiz hocam. Ben çok vakit kaybetmeden ilk sorumla başlayayım. Açık veri kapsamında yapılandırılmış birçok platform var. Az önce bahsettiğimiz bize sıklıkla bütün etkinlikleri de bahsediyoruz. Bu platformlar hangi özellikleri taşımalıdır diye sorarak başlayayım.
Ancak günümüzde geldiğimiz nokta biraz daha buradan farklı. Özellikle dokümanlar veya ham haldeki verileri sadece web sayfası üzerinden yarar sunma ihtiyaçları ne derece karşılıyor noktası biraz tartışmalı bir konu. Çünkü mevcut durum kamu kurumu olduğu zaman çok fazla kitleye çok geniş bir kitleye hitap etme durumu var ve bu verilerin yeniden kullanımı veya sağlayıcılarla sunumu noktasında da farklı özelliklerin olması gerekliliği ortaya çıkıyor. Yani bu verinin veya bu tür verilerin nasıl kullanılacağı, hangi ihtiyaca cevap vereceğini saptamak veya bunlara yönelik bütün ihtiyaçları karşılayacak bir yapının kurulmasını tabii ki platformlar sayesinde olabiliyor. Günümüzde bunun sağlayıcısı veya buna yönelik olarak hizmet veren açık kaynak kodlu da çok fazla platform var. Tabi bu tür platformların aslında bir dokümanları veya sunulan verilerin kataloğunu ilk vermesi gerekiyor. En önemli özelliklerden birisi bu tabii. Bu katalog aynı zamanda sadece insanlar tarafından erişilebilir değil, bir de makinelerce erişilebilir, anlamlandırılabilir olmalı. Özellikle burada bu veriyi tanımlamak veya bu dokümanları tanımlama noktasındaki uygulamalar ön plana çıkıyor. Bunun dışında özellikle bu dokümanları veya verinin kullanımına yönelik yönlendirmeleri içermesi gerekiyor veya aynı zamanda bir tartışma forumunu yani özellikle vatandaş, devlet veya vatandaş kamu kurum arasındaki iletişime yönelik olarak bir tartışma forumunu içerebiliyorlar. Bir dağıtım kanalını içerme durumu söz konusu. Özellikle farklı kanallar üzerinden bu verinin veya bu dokümanın, dokümanların dağıtım uygulamalarını içermesi bekleniyor. Diğer taraftan da bir geribildirim kanalı olma durumu da var. Yani yayınlanan veriye ilişkin yorumları içermek veya bu tür dokümanlarla ilgili yapılan sunumu bir yapının aslında temel düzeyde yer alması gerekiyor platformlarda.
Tabii burada özellikle platformların işlevleri veya burada veri dönüştürme özellikleri veya görselleştirme özellikleri sunduğunu da biliyoruz. Yani bazı araçları sunu, özellikle günümüzdeki popüler programlama dillerini veya yazılımları da her zaman bir analiz ettirme veya dönüştürme özelliklerini taşıdıklarını görebiliyoruz. Günümüzde de aslında beklenti biraz daha bu yönde. Yani o veri ile kullanıcının işlem yapabilmesi ihtiyacını karşılayabilmesi veya dönüştürebilmesi gibi özellikleri barındırmaları. Aslında bu tür platformlardan bekleniyor. Genel olarak sayacak olursak bu özellikler öncelikli yapıda diyebiliriz aslında.
S. Şıracı: Tabii yani sonuçta evet bir veri açtık hep zaten tartışmamızda ve anlatmaya çalıştığımız şeyde somutlaştırmaya çalışıyoruz. Az önceki anlattığınız yere kadar özellikler bunlar. Biraz da bunu teknik yönlerden sahip olması noktasına değinmekte fayda var. Aslında sınır geçiriyor oldunuz ama biraz da detaya girmemiz gerekirse o ve teknik yönlerden hangi özelliklere sahip olmasını bekleriz bir portalde.
T. Çakmak: Tabii burada aslında platform dediğimiz zaman çok daha geniş bir kapsam yani portali de kapsayan bir yapı. Ama biz günümüzde özellikle açık veri ve açık devlet uygulamaları boyutunda teknik boyutları, portalleri görüyoruz. Açık veri portali görüyoruz burada. Bu portaller aynı zamanda verinin açık verinin dağıtılması ve ve bunlara kolay erişimin sağlanması için aslında bir merkezi noktayı oluşturuyor. Özellikle aranabilir ve birden çok veri seti üzerinde arama özelliği taşıması burada en önemli aşamalardan birisi ve genellikle yeniden kullanma yani verinin yeniden kullanılması ve bundan değer üretilmesi noktasında bu portaller ciddi anlamda işlev taşıyor. Çünkü günümüzde aslında şöyle bir kavram var: bir nesne veya bir mataryel internet veya ortamında değilse veya çevrimiçi değilse yoktur gibi bir algılama da söz konusu. Dolayısıyla bu portaller aynı zamanda bu veri setlerini görünürlüğünün sağlanmasında veya işte arama motorları tarafından erişebilirliğinin sağlanmasında bir aracı rolü de bulunuyorlar. Ancak tabii burada birtakım sorunlar da söz konusu. Yani veri portali kurmak yazılımsal teknik bir boyutta yer alabilir. Ama burada özellikle kamu yönetimlerinin bu tür veri portallerini yapılandırırken farklı boyutlardaki verilere veya farklı bilgi sistemlerini kurma yoluna gittiklerini görüyoruz ve bu tür sistemlerdeki en büyük sorun aslında karşılıklı işlerlik dediğimiz verinin bir veriden bir başka sisteme daha doğrusu bir sistemden diğer sisteme aktarılması noktasında eksikliklerin olması gibi bir durum karşımıza çıkıyor. Yani bugün çok net bir şekilde işte bir yazılım geliştirebiliriz ve bu yazılımda da aynı zamanda bir veri portali yapısını kurabiliriz. Ama burada önemli olan şey bu verinin bir başka sisteme aktarılması, görünürlüğünün sağlanması noktasında da bu sistemin bir başka sistemle konuşabilmesi gerekiyor. Dolayısıyla bu tür özellikler olmadığı zaman ve veri portalleri aslında işlevini sadece kendi adresi üzerinden veri sunmakla geçirmiş oluyor. Dolayısıyla burada karşılıklı işlerlik noktasına, yani verinin transferi noktasına özel bir ilgi göstermek gerekiyor. Özellikle veri setleri bağlamında da çünkü yeniden kullanım açısından veri setleri de çok farklı formatlarda üretiliyor ve bu formatlar içerisinde günümüzde çok yaygın kullandığımız formatlardan yaygın kullanılmayan formatlara kadar çok geniş bir yelpaze olduğunu söyleyebiliriz. Bunların bir sistemden diğerine geçirilmesi de çok ciddi anlamda bir çalışmayı gerektiriyor. Tabii çözüm burada özellikle merkezi yapıların ülke partallarının kurulması boyutunda gerçekleşebiliyor veya bölgesel bir kurulumla bu süreç gerçekleşebilir veya yerel boyutta bir portalin kurulmasıyla da yapılandırılabiliyor.
Özellikle burada yerel yönetimler çerçevesinde kurulan ülkemizde de benzer portaller var ve bölgesel boyutta ülke çerçevesinde kurulan portaller var. Mesela işte Avrupa Birliği’nin kurmuş olduğu bir veri portali var. Bölgesel boyutta bu tür portallar ile de işbirliği yapılıyor olması son derece önemli ve burada bu portaller hem kurum bazında ya da bir yönetici tarafından da tabii ki yani bunun kendi içerisindeki bir yapı tarafından da yönetilebilir. Burada önemli olan yapı aslında verinin boyut açısından belli bir bölgeye belli bir yere hitap edecek şekilde yapılandırılması gerekiyor. Burada özellikle ne tür özelliklere sahip olmalı dersek özellikle veri portalleri açısından konuştuğumuzda yani bu platform aynı zamanda veri setlerine erişim sağlanması gerekiyor. Yani erişim sağlıyor olması gerekiyor. Veri setleri üzerinde arama yaptırıyor olması gerekiyor. Hatta bazen veri setinin kendi içerisindeki materyallerden veya veri setinin içerisinde yer alan verilerden dahi erişim sağlayabilir noktada bir dizinleme sistemine sahip olması gerekiyor.
Tabii burada özellikle üst veri dediğimiz kavramı kullanıyor olması ve buna göre kaynaklara zaman açısından veya ne zaman üretildi, ne zaman güncellendi gibi noktalarda erişim sağlaması gerekiyor. Bunun dışında özellik verinin yeniden kullanımı noktasında bazı uygulamaları içermesi gerekiyor. Biraz önce söylediğim gibi işte bazı görselleştirmeler ile o veri seti üzerinde uygulamaları içermesi gerekiyor ve burada özellikle bir topluluğu yönetici veya bir toplumun buluşma noktası şeklinde bu tür bir veri üzerinde analiz yapmasını sağlayacak bir mekanizma haline gelmesi gerekiyor. Özellikle veri portallerini genel olarak bu özellikleri taşıması bekliyoruz. Sektöre baktığımızda yaklaşık 16 17 tane açık kaynak kodlu yazılım söz konusu. Özellikle dünya genelinde kullanılan ve ülkelerde de özellikle bu tür yapılanmalarda açık devlet verisinin yönetiminde aktif olarak bu açık kaynak kodlu yazılımların yoğun olarak tercih edildiğini gözlemleyebiliyoruz. Bu kaynaklarda bu yazılımlarda biraz önce saydığım özellik Veri Kataloğu’nu içerme, bu veri katalogları üzerinde bütünleşik veya ön yüzden arama yapabilme gibi özellikleri içeriyorlar. Bu açıdan da aynı zamanda birer üst veriye sahipler ve bu üst veriler aslında bir noktada da verilerin görünürlüğü sağlama da çok ciddi etki sağlıyor diyebilirim.
S. Şıracı: Biraz sonra üst veriyi soracağız size ama öncesinde bu portallardaki verilerinin görünürlüğü ve erişim için de dikkat etmesi gereken bazı hususlar söz konusu. Biraz ayrıntıya girebilir miyiz bu noktada da.
Bunun dışında yine bu görünürlüğü sağlayacak veya erişimi sağlayacak bir diğer noktada entegrasyonu izin veren yapıların kurulması. Entegrasyondan kastettiğim şey biz bugün işte yerel bir portalin veya bir yerel yönetim portalinin içerisine veriyi bulmak için o adresi net olarak bilmemiz gerekiyor. Ancak biz bunu daha merkezi sistemleri içerisine entegre edecek şekilde yapılandırırsak o platformlar doğrudan sizi buraya yönlendirebiliyor. Örneğin kültür kurumları için özellikle kültürel bellek kurumları dediğimiz kütüphaneler, arşivler, müzeler için böyle bir yapılanma var Avrupa’da. Mesela Avrupa Dijital Kütüphanesi adını taşıyor. Bu platformda da Avrupa’dan ve Türkiye’den de bazı kurumların, bazı arşivlerin müzelerin kendi nesnelerine ilişkin üst veriler var. Bu platform üzerinden aradığınızda siz herhangi bir şekilde nerede olduğunu şu ana kadar bilmediğiniz adresini tam olarak bilmediğiniz bir yere merkezi bir platform üzerinden erişim sağlayabiliyorsunuz ve bu platform size aslında daha önce hiç farkında olmadığınız bir nesneyi bir başka Avrupa’nın bir kentindeki bir müzede olduğunu tespit etmenizi sağlayabiliyor. Dolayısıyla böyle bir yapıya sahip olması gerekiyor veri setlerinin bulunduğu veya kamu verisinin tutulduğu bu tür sistemler için. Benzer bir uygulamayı günümüzde e devlet içerisinde görebiliyoruz. Örneğin işte araçları menüsü içerisinde sunulan yapıda birbirinden farklı kurumlar ama tek bir menü altında bir araya getirilmiş. Biz onun hangi kurumdan geldiğini bilmek durumunda değiliz ama o hizmetten yararlanabiliyoruz. Veri setleri için de bu tür bir merkezi yapının yönetim açısından da görünürlük sağlama açısından kurulması aslında hem kamudaki kurumların veri setlerinin daha erişilebilir olmasından hem de daha fazla kullanımını sağlama açısından önem taşıyor. Tabi bunu yapabilmek içinde öncelikle alt portallerin yani kurum bazındaki bireysel portallerin veya yerel yönetim portalleri bu sistemleri uygun bir şekilde yapılandırılmış olması bu tür standartlara net olarak sahip olması gerekliliği karşımıza çıkıyor.
T. Çakmak: Tabii, özellikle üst veri dediğimiz kavram aslında verinin ne olduğunu açıklayan veya verinin yerini gösteren, veri ile ilgili ayrıntıları sunan bir kavram. Yani daha çok bunu disiplinlerin ve alanların farklı şekilde tanımladığını da görüyoruz. En bilinen tanımı data about data, yani veri hakkında veri olarak geçen bir kavramı var. Ancak burada alanlar bazında baktığımızda bilgisayar bilimleri bu süreci biraz daha farklı tanımlayabiliyor bir veri olarak işte herhangi bir nesnenin bitlerle ifade edilmesi gibi tanımlar da söz konusu. Ancak üst veri dediğimiz yapı aslında bir nesnenin ne olduğunu gösteren, nasıl olduğunu açıklayan veya bunun içerisindeki diğer ayrıntılarını sunan, kim tarafından üretildiğini sahipliğini gösteren, kullanım haklarını gösteren ve o veriyi anlatan aslında diğer veriler diyebiliriz. Buna ilişkin birtakım standartlar çerçevesinde kullanılıyor. Üst veriyi yönetmek son derece önemli çünkü aslında siz o veri seti tanımladığınız zaman aslında o veri setinin ne olduğunu anlatabiliyorsunuz ve bu makinelerce anlaşılabildiğinde veri daha aktif bir şekilde arama motorlarında görünür olabiliyor. Belli bir süre önce örneğin arama motorlarının politikalarında bu tür yapılar vardı ve veri kimliklenmesi bağlamında. Günümüzde de var aynı zamanda ama daha farklı şekillerde çalışıyor. Bir web sayfasının bu tür tanımlayıcı bilgilerine sahip olması, o web sayfasını bizim aslında yüzeysel web dediğimiz webe çıkmasını sağlayabiliyor. Yani arama motorlarınca görünür olabiliyor.
Benzer bir uygulama burada bütün nesneler için geçerli. Üst veriye sahip olan veri setleri veya üst veriye sahip olan bilgi nesneleri günümüzdeki sistemler tarafından anlaşılabiliyor ve elde edilebiliyor. Sonrasında farklı amaçlarla da erişilebilirlik görünebilirlik anlamında kullanılabiliyor. Dolayısıyla burada üst veriyi yönetmek veya üst veri kurgusunu bir veri seti için yapmak son derece önemli. Tabi burada hangi bilgiler aslında bir veri seti için sunulacak, hangi ayrıntılara bu veri seti içerisinde yer verilmesi gerekiyor gibi noktaların yöneticiler tarafından teknik ekip tarafından ele alınması gerekiyor. Yani bir veri seti için olmazsa olmaz tanımlayıcı alanlar nelerdir mesela veya opsiyonel olarak sunulabilecek alanlar nelerdir bunların belirtilmesi gerekiyor. Özellikle bir veri setini tanımlayan veya bunun dağıtımını sağlayan önemli yönlerinin belirtilmesi gerektiğini görüyoruz. Veri portalleri de özellikle bu tür bir standardın yapılandırılması gerekiyor. Yerel anlamda da veya açık kaynak kodlu bir yazılım değilse veya böyle bir standardı desteklemiyorsa bu standardı destekleyecek bir yapının tercih edilmesi son derece önemli. Yani burada veri setleri bazında hangi özellikleriyle yer verilmesi gerektiği sorulduğunda da hani burada özellikle genel uygulama açısından bir tanımlayıcı üst veriye sahip olması gerekir. Yani o veri setinin genel özelliklerini ele alan alanlara yer vermek gerekiyor. Mesela bunlar birincisi veri setinin adıdır yani başlığıdır. Hangi veri seti olduğunu birincisi açıklama noktası bu son derece önemlidir. Bunun dışında bir description yani açıklama alanının olması gerekiyor. O veri setinin içerisinde ne var, hangi döneme ilişkin bilgi veriyor veya veri setinin genel yapısı ne mesela bu son derece önemli noktalardan birisi.
Bir diğeri bu veri setine erişim için veya veri setinin içeriğinde bulunan anahtar kelimelerin neler olduğunun belirlenmesi. Bu veri setinin yine ne zaman yayınlandığı bilgisinin verilmesi veya bu veri setinden kimin sorumlu olduğunun belirtilmesi, özellikle kamu kurumlarındaki veri paylaşımı açısından önem taşıyor. Yani bu veri setinin yayıncılık ki bu bizim için. Aslında günümüzde bilgi okuryazarlığı dediğimiz veya bilginin doğrulanması noktasında da önemli yaşayan verileri aslında biz üst veri ile sunmaya çalışıyoruz. Özellikle bir kurumdan geliyorsa bu verinin güvenilirliği veya resmi hakkında da bilgi sahibi olabiliyoruz. Bunun dışında bu veri setiyle ilişkili iletişim kişisi kimdir, kime sorulması gerekiyor. Bir ayrıntıları içermesi lazım yine bunun dışında özellikle tercih edilebilecek bir diğer alan veri setinin coğrafi konum açısından hangi bölgelere ait bir bilgi içerik günümüzde bunu biz yine veri portalleri de görebiliyoruz. Benzer harita eklentileri ile veri setinin hangi bölgeye ait olduğunu gösterebilen yapılar söz konusu. Bunu yapabilmek içinde o veri setinin hangi ilden, hangi ülkeden, hangi bölgede toplantıya ilişkin bir verinin sisteme tanımlanması gerekiyor. Yine veri setinin taşıdığı veya kapsadığı bu zaman dilimine ilişkin de bölgeye ilişkin ayrıntıların sunulması son derece önemli. Üst veri tasarımı açıları açısından ve yine bir veri setini tanımlarken en son düzenleme ne zaman yapılmış, son güncelleme tarihi nedir gibi ayrıntıları mutlaka bu yapı içerisinde belirtmek gerekli. Tabii bir başka boyut da şu. Yine bu veri seti hangi kategoride yer alıyor? Biz bugün günümüzde yerel yönetimler veya diğer uygulamalarda birçok kategori altında bu gazetelerin yayınlandığını görüyoruz. Işte ulaşım, finans, ekonomi veya eğitim başlıkları gibi başlıklar içeriye biliyorlar. Bu veri setinin ilgili olduğu kategori, tema tam olarak nedir? Bunların açık bir şekilde üst veri yapısı içerisinde veri setini sisteme yüklerken de girilmesi ve kullanması gerekliliği karşımıza çıkıyor. Tabi bunlar bir noktada iş sürecinin biraz daha arttırıyor olabilir. Özellikle veri yükleyen veya veriyi bu sistemi tanımlayan lar için bu hiçbir iş süreci gerektirebilir. Ama buradan elde edilecek kazanın verinin daha fazla görünürlüğü ve daha fazla aslında değer üretilmesi, bir yandan da bu verinin doğruluğu ve resmiyeti içinde aslında fikir sahibi olmuş oluyor. Kullanıcı bir diğer nokta özellikle bu verinin kullanım lisansları yani veri seti bazında burada farklı uygulamalar olabiliyor. Dolayısıyla veri setlerini bu tür portalları tanımlarken de bu lisansların veri seti bazında neleri içermesi gerektiği gerekiyor gibi ayrıntılar bu içerikte sunulması gerekiyor ve buna ilişkin alanların yer aldığı standartlarda günümüzde özellikle veri portallerinde yaygın olarak kullanılıyor diyebilirim.
S. Şıracı: Evet çok teşekkürler hocam gayet dolu dolu aslında bütün adımlarımı bize aktarmış oldunuz. O yüzden çok memnunuz tabi çünkü her zaman bu teknik bilgilerle donanamıyoruz ve ve gerçekten bilgi erişmek isteyenin derli toplu bir yer bulması gerçekten çok kıymetli. Ama bir son soru soracağım bizim açık verideki meselesi bu süreklilik aslında. Yani burada portalları kurduk işte bu üst veri yönetimi sürekliliğinin sağlanması gerekiyor. Haliyle burada yani süremiz azaldı ama yine de uygulama örneklerinden de aktarabilirseniz çok memnun oluruz.