[Açık Kürsü] 18. Bölüm: Açık Veri ve Üst Veri Yönetimi – Doç. Dr. Tolga Çakmak

Açık bilim, açık erişim, açık devlet, açık veri, açık teknoloji gibi kavramları uzmanlarıyla konuşacağımız Sertel Şıracı ile Açık Kürsü program serimizin 18. bölümünde Hacettepe Üniversitesi Edebiyat Fakültesi Bilgi ve Belge Yönetimi Bölümü Öğretim Üyesi Doç. Dr. Tolga Çakmak konuğumuz oldu ve sorularımızı yanıtladı.

– Açık Veri Kapsamında Yapılandırılan Platformlar Hangi Özellikleri Taşımalı?

– Açık Veri Portalları Teknik Açıdan Hangi Özelliklere Sahip Olmalı?

– Açık Veri Portallarında Veri Erişimi Nasıl Olmalı?

– Üst Veri Nedir? Üst Veri Yönetimi Niçin Önemlidir?

– Açık Veri Portalları ve Üst Verilerin Yönetimi Açısından Ne Tür Uygulamalar Var?

Yeni bölümlerimizi kaçırmamak için Youtube abonemiz olabilir, podcast kanallarımızdan (SpotifyApple PodcastGoogle PodcastDeezerSoundCloud vb.) takip edebilirsiniz. Programın deşifresini videonun altında bulabilirsiniz.

Sertel Şıracı: Herkese merhaba, Açık Veri ve Tek Derneği’nin Açık Kürsü programına hoş geldiniz! Bildiğiniz gibi açık verinin dijital külliyatını yaratmaya çalışıyoruz. Bunu yaparken de birçok değerli konuklarımızı ağırlıyoruz. Bugün açık kürsünün konuğu Sayın Doçent Doktor Tolga Çakmak. Kendisi Hacettepe Üniversitesi Öğretim Üyesi ve aynı zamanda da Dijital Dönüşüm Ofisi’nde çok kıymetli görevleri var.

Bildiğiniz gibi son zamanlarda biz sürekli işin dikeydeki uygulamalarını kamu tarafındaki uygulama belediyecilik tarafındaki uygulama aktarırken sürekli birtakım platform diyoruz. İşte açık verilerden bahsediyoruz, bunların ne olduğuyla ilgili de yeni bir kademeye geçelim istedik. O yüzden sağ olsun hocamız kırmadı bizleri Tolga Çakmak aramızda. Hoş geldiniz hocam.

 

Tolga Çakmak: Hoş bulduk, merhaba!

 

S. Şıracı: Teşekkür ederiz hocam. Ben çok vakit kaybetmeden ilk sorumla başlayayım. Açık veri kapsamında yapılandırılmış birçok platform var. Az önce bahsettiğimiz bize sıklıkla bütün etkinlikleri de bahsediyoruz. Bu platformlar hangi özellikleri taşımalıdır diye sorarak başlayayım.

 

T. Çakmak: Çok teşekkür ediyorum öncelikle. Yani konunun teknik tarafında hem platformlar ve özellikle portaller bu noktada yapılandırılıyor. Günümüzde dünyada çok fazla örneği var. Hatta bunların 2015 yılındaki örneklerine baktığımız zaman 1600 civarında portalin olduğu dünya üzerinde bu 2015 verisi yaklaşık 6 7 yıl önceki veri. Bu tür bir açık veri portali girişimi yani kurulumu gelişimin olduğunu görüyoruz. Burada özellikle açık veri kapsamında yapılandırılan platformlar tabii esas öncelikli amaç kamudaki verilerin paylaşımı yani kamu kurumlarının verilerini paylaşma noktasında kurdukları platformlar aslında bu noktada öncelikli hale geliyor. Özellikle açık devlet yaklaşımları çerçevesinde kamu kurumlarının bu verileri kendi web sayfalarında veya işte pdf formatında belirli formatlar da yayınladıklarını görebiliyoruz.

Ancak günümüzde geldiğimiz nokta biraz daha buradan farklı. Özellikle dokümanlar veya ham haldeki verileri sadece web sayfası üzerinden yarar sunma ihtiyaçları ne derece karşılıyor noktası biraz tartışmalı bir konu. Çünkü mevcut durum kamu kurumu olduğu zaman çok fazla kitleye çok geniş bir kitleye hitap etme durumu var ve bu verilerin yeniden kullanımı veya sağlayıcılarla sunumu noktasında da farklı özelliklerin olması gerekliliği ortaya çıkıyor. Yani bu verinin veya bu tür verilerin nasıl kullanılacağı, hangi ihtiyaca cevap vereceğini saptamak veya bunlara yönelik bütün ihtiyaçları karşılayacak bir yapının kurulmasını tabii ki platformlar sayesinde olabiliyor. Günümüzde bunun sağlayıcısı veya buna yönelik olarak hizmet veren açık kaynak kodlu da çok fazla platform var. Tabi bu tür platformların aslında bir dokümanları veya sunulan verilerin kataloğunu ilk vermesi gerekiyor. En önemli özelliklerden birisi bu tabii. Bu katalog aynı zamanda sadece insanlar tarafından erişilebilir değil, bir de makinelerce erişilebilir, anlamlandırılabilir olmalı. Özellikle burada bu veriyi tanımlamak veya bu dokümanları tanımlama noktasındaki uygulamalar ön plana çıkıyor. Bunun dışında özellikle bu dokümanları veya verinin kullanımına yönelik yönlendirmeleri içermesi gerekiyor veya aynı zamanda bir tartışma forumunu yani özellikle vatandaş, devlet veya vatandaş kamu kurum arasındaki iletişime yönelik olarak bir tartışma forumunu içerebiliyorlar. Bir dağıtım kanalını içerme durumu söz konusu. Özellikle farklı kanallar üzerinden bu verinin veya bu dokümanın, dokümanların dağıtım uygulamalarını içermesi bekleniyor. Diğer taraftan da bir geribildirim kanalı olma durumu da var. Yani yayınlanan veriye ilişkin yorumları içermek veya bu tür dokümanlarla ilgili yapılan sunumu bir yapının aslında temel düzeyde yer alması gerekiyor platformlarda.

 

Tabii burada özellikle platformların işlevleri veya burada veri dönüştürme özellikleri veya görselleştirme özellikleri sunduğunu da biliyoruz. Yani bazı araçları sunu, özellikle günümüzdeki popüler programlama dillerini veya yazılımları da her zaman bir analiz ettirme veya dönüştürme özelliklerini taşıdıklarını görebiliyoruz. Günümüzde de aslında beklenti biraz daha bu yönde. Yani o veri ile kullanıcının işlem yapabilmesi ihtiyacını karşılayabilmesi veya dönüştürebilmesi gibi özellikleri barındırmaları. Aslında bu tür platformlardan bekleniyor. Genel olarak sayacak olursak bu özellikler öncelikli yapıda diyebiliriz aslında.

 

S. Şıracı: Tabii yani sonuçta evet bir veri açtık hep zaten tartışmamızda ve anlatmaya çalıştığımız şeyde somutlaştırmaya çalışıyoruz. Az önceki anlattığınız yere kadar özellikler bunlar. Biraz da bunu teknik yönlerden sahip olması noktasına değinmekte fayda var. Aslında sınır geçiriyor oldunuz ama biraz da detaya girmemiz gerekirse o ve teknik yönlerden hangi özelliklere sahip olmasını bekleriz bir portalde.

 

T. Çakmak: Tabii burada aslında platform dediğimiz zaman çok daha geniş bir kapsam yani portali de kapsayan bir yapı. Ama biz günümüzde özellikle açık veri ve açık devlet uygulamaları boyutunda teknik boyutları, portalleri görüyoruz. Açık veri portali görüyoruz burada. Bu portaller aynı zamanda verinin açık verinin dağıtılması ve ve bunlara kolay erişimin sağlanması için aslında bir merkezi noktayı oluşturuyor. Özellikle aranabilir ve birden çok veri seti üzerinde arama özelliği taşıması burada en önemli aşamalardan birisi ve genellikle yeniden kullanma yani verinin yeniden kullanılması ve bundan değer üretilmesi noktasında bu portaller ciddi anlamda işlev taşıyor. Çünkü günümüzde aslında şöyle bir kavram var: bir nesne veya bir mataryel internet veya ortamında değilse veya çevrimiçi değilse yoktur gibi bir algılama da söz konusu. Dolayısıyla bu portaller aynı zamanda bu veri setlerini görünürlüğünün sağlanmasında veya işte arama motorları tarafından erişebilirliğinin sağlanmasında bir aracı rolü de bulunuyorlar. Ancak tabii burada birtakım sorunlar da söz konusu. Yani veri portali kurmak yazılımsal teknik bir boyutta yer alabilir. Ama burada özellikle kamu yönetimlerinin bu tür veri portallerini yapılandırırken farklı boyutlardaki verilere veya farklı bilgi sistemlerini kurma yoluna gittiklerini görüyoruz ve bu tür sistemlerdeki en büyük sorun aslında karşılıklı işlerlik dediğimiz verinin bir veriden bir başka sisteme daha doğrusu bir sistemden diğer sisteme aktarılması noktasında eksikliklerin olması gibi bir durum karşımıza çıkıyor. Yani bugün çok net bir şekilde işte bir yazılım geliştirebiliriz ve bu yazılımda da aynı zamanda bir veri portali yapısını kurabiliriz. Ama burada önemli olan şey bu verinin bir başka sisteme aktarılması, görünürlüğünün sağlanması noktasında da bu sistemin bir başka sistemle konuşabilmesi gerekiyor. Dolayısıyla bu tür özellikler olmadığı zaman ve veri portalleri aslında işlevini sadece kendi adresi üzerinden veri sunmakla geçirmiş oluyor. Dolayısıyla burada karşılıklı işlerlik noktasına, yani verinin transferi noktasına özel bir ilgi göstermek gerekiyor. Özellikle veri setleri bağlamında da çünkü yeniden kullanım açısından veri setleri de çok farklı formatlarda üretiliyor ve bu formatlar içerisinde günümüzde çok yaygın kullandığımız formatlardan yaygın kullanılmayan formatlara kadar çok geniş bir yelpaze olduğunu söyleyebiliriz. Bunların bir sistemden diğerine geçirilmesi de çok ciddi anlamda bir çalışmayı gerektiriyor. Tabii çözüm burada özellikle merkezi yapıların ülke partallarının kurulması boyutunda gerçekleşebiliyor veya bölgesel bir kurulumla bu süreç gerçekleşebilir veya yerel boyutta bir portalin kurulmasıyla da yapılandırılabiliyor.

 

Özellikle burada yerel yönetimler çerçevesinde kurulan ülkemizde de benzer portaller var ve bölgesel boyutta ülke çerçevesinde kurulan portaller var. Mesela işte Avrupa Birliği’nin kurmuş olduğu bir veri portali var. Bölgesel boyutta bu tür portallar ile de işbirliği yapılıyor olması son derece önemli ve burada bu portaller hem kurum bazında ya da bir yönetici tarafından da tabii ki yani bunun kendi içerisindeki bir yapı tarafından da yönetilebilir. Burada önemli olan yapı aslında verinin boyut açısından belli bir bölgeye belli bir yere hitap edecek şekilde yapılandırılması gerekiyor. Burada özellikle ne tür özelliklere sahip olmalı dersek özellikle veri portalleri açısından konuştuğumuzda yani bu platform aynı zamanda veri setlerine erişim sağlanması gerekiyor. Yani erişim sağlıyor olması gerekiyor. Veri setleri üzerinde arama yaptırıyor olması gerekiyor. Hatta bazen veri setinin kendi içerisindeki materyallerden veya veri setinin içerisinde yer alan verilerden dahi erişim sağlayabilir noktada bir dizinleme sistemine sahip olması gerekiyor.

 

Tabii burada özellikle üst veri dediğimiz kavramı kullanıyor olması ve buna göre kaynaklara zaman açısından veya ne zaman üretildi, ne zaman güncellendi gibi noktalarda erişim sağlaması gerekiyor. Bunun dışında özellik verinin yeniden kullanımı noktasında bazı uygulamaları içermesi gerekiyor. Biraz önce söylediğim gibi işte bazı görselleştirmeler ile o veri seti üzerinde uygulamaları içermesi gerekiyor ve burada özellikle bir topluluğu yönetici veya bir toplumun buluşma noktası şeklinde bu tür bir veri üzerinde analiz yapmasını sağlayacak bir mekanizma haline gelmesi gerekiyor. Özellikle veri portallerini genel olarak bu özellikleri taşıması bekliyoruz. Sektöre baktığımızda yaklaşık 16 17 tane açık kaynak kodlu yazılım söz konusu. Özellikle dünya genelinde kullanılan ve ülkelerde de özellikle bu tür yapılanmalarda açık devlet verisinin yönetiminde aktif olarak bu açık kaynak kodlu yazılımların yoğun olarak tercih edildiğini gözlemleyebiliyoruz. Bu kaynaklarda bu yazılımlarda biraz önce saydığım özellik Veri Kataloğu’nu içerme, bu veri katalogları üzerinde bütünleşik veya ön yüzden arama yapabilme gibi özellikleri içeriyorlar. Bu açıdan da aynı zamanda birer üst veriye sahipler ve bu üst veriler aslında bir noktada da verilerin görünürlüğü sağlama da çok ciddi etki sağlıyor diyebilirim.

 

S. Şıracı: Biraz sonra üst veriyi soracağız size ama öncesinde bu portallardaki verilerinin görünürlüğü ve erişim için de dikkat etmesi gereken bazı hususlar söz konusu. Biraz ayrıntıya girebilir miyiz bu noktada da.

 

T. Çakmakçı: Tabii ki. Burada yani portallerde veri sunmak tek başına yeterli olmuyor. Yani bir arka planda size sağlam bir kullanıcı ara yüzünden bilgisayarınızdan veya ilgili kurumun yetkisi dahilinde sisteme veri aktarmak tek başına yetmiyor. Yani bir Excel dokümanını sisteme tek başına yüklemek o veriyi görünür kılmaya yetmiyor. Dolayısıyla burada bu veriyi tanımlayacak diğer ayrıntılarının yani o veri setinin tanımının ve diğer özelliklerin de sunulması gerekiyor. Tabi bu özellikleri sunarken de biraz sonra da sizin soracağınızı söylediğiniz bu özellikle üst veri konusuna ayrıca dikkat çekmekte yarar var. Çünkü üst veri aynı zamanda bu verilerin makinece anlamlandırabilmesi veya işte bir seti tanımlarken kullandığınız ifadelerin makineler tarafından işlenebilmesini sağlıyor. Yalnızca insanlar içinden, insanlarınca anlaşılır hale gelmiyor, diğer taraftan da makinece aynı zamanda bu veri setini anlaşılabilir, daha çok kullanılabilir hale getiriyor.

Bunun dışında yine bu görünürlüğü sağlayacak veya erişimi sağlayacak bir diğer noktada entegrasyonu izin veren yapıların kurulması. Entegrasyondan kastettiğim şey biz bugün işte yerel bir portalin veya bir yerel yönetim portalinin içerisine veriyi bulmak için o adresi net olarak bilmemiz gerekiyor. Ancak biz bunu daha merkezi sistemleri içerisine entegre edecek şekilde yapılandırırsak o platformlar doğrudan sizi buraya yönlendirebiliyor. Örneğin kültür kurumları için özellikle kültürel bellek kurumları dediğimiz kütüphaneler, arşivler, müzeler için böyle bir yapılanma var Avrupa’da. Mesela Avrupa Dijital Kütüphanesi adını taşıyor. Bu platformda da Avrupa’dan ve Türkiye’den de bazı kurumların, bazı arşivlerin müzelerin kendi nesnelerine ilişkin üst veriler var. Bu platform üzerinden aradığınızda siz herhangi bir şekilde nerede olduğunu şu ana kadar bilmediğiniz adresini tam olarak bilmediğiniz bir yere merkezi bir platform üzerinden erişim sağlayabiliyorsunuz ve bu platform size aslında daha önce hiç farkında olmadığınız bir nesneyi bir başka Avrupa’nın bir kentindeki bir müzede olduğunu tespit etmenizi sağlayabiliyor. Dolayısıyla böyle bir yapıya sahip olması gerekiyor veri setlerinin bulunduğu veya kamu verisinin tutulduğu bu tür sistemler için. Benzer bir uygulamayı günümüzde e devlet içerisinde görebiliyoruz. Örneğin işte araçları menüsü içerisinde sunulan yapıda birbirinden farklı kurumlar ama tek bir menü altında bir araya getirilmiş. Biz onun hangi kurumdan geldiğini bilmek durumunda değiliz ama o hizmetten yararlanabiliyoruz. Veri setleri için de bu tür bir merkezi yapının yönetim açısından da görünürlük sağlama açısından kurulması aslında hem kamudaki kurumların veri setlerinin daha erişilebilir olmasından hem de daha fazla kullanımını sağlama açısından önem taşıyor. Tabi bunu yapabilmek içinde öncelikle alt portallerin yani kurum bazındaki bireysel portallerin veya yerel yönetim portalleri bu sistemleri uygun bir şekilde yapılandırılmış olması bu tür standartlara net olarak sahip olması gerekliliği karşımıza çıkıyor.

 

S. Şıracı: Şimdi üst veriyi de bir soralım size. Az önce cümle içerisinde sürekli geçirdik tabii konuyu ama asıl açıklamasını yapmış bulundunuz ama yine de bir detayına girelim. Burada bizim için üst veri nedir ve neden önem taşıyor?

T. Çakmak: Tabii, özellikle üst veri dediğimiz kavram aslında verinin ne olduğunu açıklayan veya verinin yerini gösteren, veri ile ilgili ayrıntıları sunan bir kavram. Yani daha çok bunu disiplinlerin ve alanların farklı şekilde tanımladığını da görüyoruz. En bilinen tanımı data about data, yani veri hakkında veri olarak geçen bir kavramı var. Ancak burada alanlar bazında baktığımızda bilgisayar bilimleri bu süreci biraz daha farklı tanımlayabiliyor bir veri olarak işte herhangi bir nesnenin bitlerle ifade edilmesi gibi tanımlar da söz konusu. Ancak üst veri dediğimiz yapı aslında bir nesnenin ne olduğunu gösteren, nasıl olduğunu açıklayan veya bunun içerisindeki diğer ayrıntılarını sunan, kim tarafından üretildiğini sahipliğini gösteren, kullanım haklarını gösteren ve o veriyi anlatan aslında diğer veriler diyebiliriz. Buna ilişkin birtakım standartlar çerçevesinde kullanılıyor. Üst veriyi yönetmek son derece önemli çünkü aslında siz o veri seti tanımladığınız zaman aslında o veri setinin ne olduğunu anlatabiliyorsunuz ve bu makinelerce anlaşılabildiğinde veri daha aktif bir şekilde arama motorlarında görünür olabiliyor. Belli bir süre önce örneğin arama motorlarının politikalarında bu tür yapılar vardı ve veri kimliklenmesi bağlamında. Günümüzde de var aynı zamanda ama daha farklı şekillerde çalışıyor. Bir web sayfasının bu tür tanımlayıcı bilgilerine sahip olması, o web sayfasını bizim aslında yüzeysel web dediğimiz webe çıkmasını sağlayabiliyor. Yani arama motorlarınca görünür olabiliyor.

 

Benzer bir uygulama burada bütün nesneler için geçerli. Üst veriye sahip olan veri setleri veya üst veriye sahip olan bilgi nesneleri günümüzdeki sistemler tarafından anlaşılabiliyor ve elde edilebiliyor. Sonrasında farklı amaçlarla da erişilebilirlik görünebilirlik anlamında kullanılabiliyor. Dolayısıyla burada üst veriyi yönetmek veya üst veri kurgusunu bir veri seti için yapmak son derece önemli. Tabi burada hangi bilgiler aslında bir veri seti için sunulacak, hangi ayrıntılara bu veri seti içerisinde yer verilmesi gerekiyor gibi noktaların yöneticiler tarafından teknik ekip tarafından ele alınması gerekiyor. Yani bir veri seti için olmazsa olmaz tanımlayıcı alanlar nelerdir mesela veya opsiyonel olarak sunulabilecek alanlar nelerdir bunların belirtilmesi gerekiyor. Özellikle bir veri setini tanımlayan veya bunun dağıtımını sağlayan önemli yönlerinin belirtilmesi gerektiğini görüyoruz. Veri portalleri de özellikle bu tür bir standardın yapılandırılması gerekiyor. Yerel anlamda da veya açık kaynak kodlu bir yazılım değilse veya böyle bir standardı desteklemiyorsa bu standardı destekleyecek bir yapının tercih edilmesi son derece önemli. Yani burada veri setleri bazında hangi özellikleriyle yer verilmesi gerektiği sorulduğunda da hani burada özellikle genel uygulama açısından bir tanımlayıcı üst veriye sahip olması gerekir. Yani o veri setinin genel özelliklerini ele alan alanlara yer vermek gerekiyor. Mesela bunlar birincisi veri setinin adıdır yani başlığıdır. Hangi veri seti olduğunu birincisi açıklama noktası bu son derece önemlidir. Bunun dışında bir description yani açıklama alanının olması gerekiyor. O veri setinin içerisinde ne var, hangi döneme ilişkin bilgi veriyor veya veri setinin genel yapısı ne mesela bu son derece önemli noktalardan birisi.

 

Bir diğeri bu veri setine erişim için veya veri setinin içeriğinde bulunan anahtar kelimelerin neler olduğunun belirlenmesi. Bu veri setinin yine ne zaman yayınlandığı bilgisinin verilmesi veya bu veri setinden kimin sorumlu olduğunun belirtilmesi, özellikle kamu kurumlarındaki veri paylaşımı açısından önem taşıyor. Yani bu veri setinin yayıncılık ki bu bizim için. Aslında günümüzde bilgi okuryazarlığı dediğimiz veya bilginin doğrulanması noktasında da önemli yaşayan verileri aslında biz üst veri ile sunmaya çalışıyoruz. Özellikle bir kurumdan geliyorsa bu verinin güvenilirliği veya resmi hakkında da bilgi sahibi olabiliyoruz. Bunun dışında bu veri setiyle ilişkili iletişim kişisi kimdir, kime sorulması gerekiyor. Bir ayrıntıları içermesi lazım yine bunun dışında özellikle tercih edilebilecek bir diğer alan veri setinin coğrafi konum açısından hangi bölgelere ait bir bilgi içerik günümüzde bunu biz yine veri portalleri de görebiliyoruz. Benzer harita eklentileri ile veri setinin hangi bölgeye ait olduğunu gösterebilen yapılar söz konusu. Bunu yapabilmek içinde o veri setinin hangi ilden, hangi ülkeden, hangi bölgede toplantıya ilişkin bir verinin sisteme tanımlanması gerekiyor. Yine veri setinin taşıdığı veya kapsadığı bu zaman dilimine ilişkin de bölgeye ilişkin ayrıntıların sunulması son derece önemli. Üst veri tasarımı açıları açısından ve yine bir veri setini tanımlarken en son düzenleme ne zaman yapılmış, son güncelleme tarihi nedir gibi ayrıntıları mutlaka bu yapı içerisinde belirtmek gerekli. Tabii bir başka boyut da şu. Yine bu veri seti hangi kategoride yer alıyor? Biz bugün günümüzde yerel yönetimler veya diğer uygulamalarda birçok kategori altında bu gazetelerin yayınlandığını görüyoruz. Işte ulaşım, finans, ekonomi veya eğitim başlıkları gibi başlıklar içeriye biliyorlar. Bu veri setinin ilgili olduğu kategori, tema tam olarak nedir? Bunların açık bir şekilde üst veri yapısı içerisinde veri setini sisteme yüklerken de girilmesi ve kullanması gerekliliği karşımıza çıkıyor. Tabi bunlar bir noktada sürecinin biraz daha arttırıyor olabilir. Özellikle veri yükleyen veya veriyi bu sistemi tanımlayan lar için bu hiçbir süreci gerektirebilir. Ama buradan elde edilecek kazanın verinin daha fazla görünürlüğü ve daha fazla aslında değer üretilmesi, bir yandan da bu verinin doğruluğu ve resmiyeti içinde aslında fikir sahibi olmuş oluyor. Kullanıcı bir diğer nokta özellikle bu verinin kullanım lisansları yani veri seti bazında burada farklı uygulamalar olabiliyor. Dolayısıyla veri setlerini bu tür portalları tanımlarken de bu lisansların veri seti bazında neleri içermesi gerektiği gerekiyor gibi ayrıntılar bu içerikte sunulması gerekiyor ve buna ilişkin alanların yer aldığı standartlarda günümüzde özellikle veri portallerinde yaygın olarak kullanılıyor diyebilirim.

 

S. Şıracı: Evet çok teşekkürler hocam gayet dolu dolu aslında bütün adımlarımı bize aktarmış oldunuz. O yüzden çok memnunuz tabi çünkü her zaman bu teknik bilgilerle donanamıyoruz ve ve gerçekten bilgi erişmek isteyenin derli toplu bir yer bulması gerçekten çok kıymetli. Ama bir son soru soracağım bizim açık verideki meselesi bu süreklilik aslında. Yani burada portalları kurduk işte bu üst veri yönetimi sürekliliğinin sağlanması gerekiyor. Haliyle burada yani süremiz azaldı ama yine de uygulama örneklerinden de aktarabilirseniz çok memnun oluruz.

 

T. Çakmak: Tabii ki memnuniyetle. Şimdi biraz önce saydığım maddeler aslında bir nokta da bu veri setinin ve yayınlanması sürecini biraz daha uzatıyor olabilir. Yani biz burada genelde örneklere baktığımızda işte ne görüyoruz? Bir portale arka plandan kurumdaki bir yetkili veri setini yüklemesi olarak görüyoruz ve bu seti yüklerken de biraz önce saydığım üst veri alanlarını doldursa yaklaşık 15 16 tane veri elemanını veya tanımlama elemanın da sisteme girmesi gerekiyor. Şimdi bu noktada karşımıza özellikle bu tür portallerde şöyle bir yapı çıkıyor. Evet biz 50 veri setini yüklüyoruz ama bu veri seti çoğu zaman veya bu tür veriler çoğu zaman dinamik veriler yani bir kere üretilip de ondan sonra kalan veriler değil. Örneğin işte o en net örneğini hava kirliliği verisine göre gösterilir. Yani bir bölgedeki hava kirliliği verisini siz günlük olarak hatta bazen saatlik olarak güncellemeniz gerekir. Şimdi bu tür bir güncelleme sürecinde verinin bir kere yayınlanması ve sonrasında tekrardan ben gün bazında saat bazında bu portale bu veriyi teker teker yüklemem anlamına gelir. Bu noktada da özellikle otomatize edilmiş yapıların geliştirildiğini görüyoruz. Yani evet bir veri seti kullanıyor veya biz günlük kamu uygulamaları çerçevesinde kamu kurumları kendi hizmetlerini verirken bu verileri üretiyor ve sürekli üretilen bir yapı var ve bu veri setlerinin bu tür portaller de sunumu da aynı zamanda bir süreklilik gerektiriyor. Yani ben bugün işte hava kirliliği verisine yayınladıysa veri bir gün sonra eskimiş hale geliyor tekrardan yüklemem gerekiyor. Dolayısıyla burada sistem bazında özellikle üst veri harmanlama yapısı dediğimiz üst veri den verileri tekrardan çeken ve bunları merkezi platformlara otomatik olarak aktaran yapıların kurulduğunu görüyoruz. Örneğin burada en iyi örneklerden birisi belki de Avustralya’nın Açık Veri Portali’dir. Avustralya’nın Açık veri Portal’inde bulunan verilerin yüzde 92′ hatırladığım kadarıyla otomatize edilmiş bir sistem tarafından sağlanıyor. Bunları da arkada diye bir sistem gördü kadarıyla bu sistem şöyle bir şey yapıyor: Kamu kurumlarının web siteleri n e aynı bir arama motoru örümceği gibi inceleyip orada yayınları açık veri portal yerinde ve açık verileri saptayıp. Sonrasında da ülkenin ulusal portalini bununla ilgili bir sayfa açıp o verinin üst verilerini otomatikman buraya aktarabiliyor. Şimdi bu aynı zamanda belirli sürelerle çalıştırılan bir arama motoru yapısı. Bildiğim kadarıyla 10 günde bir güncelleniyordu ama bu tür bir avantaj aynı zamanda insanın bu noktada sürecini veya bu veri sürekli güncellemesini önüne geçebiliyor. Yani karşılıklı işlerlik ten aslında kastetmek istediğim yapıda biraz da bu. Bu tür bir platform aynı zamanda veri setlerinin merkezi sistemlerde veya yerel yönetim sistemlerinde de alttaki daire başkanlıklarına mesaj anlamış olduğu veriler var. Bunları otomatikman çekip ana portal üzerinden sunabilmesi bir yükünün veya bu tür bir kaybın da aslında önüne geçebiliyor. Dolayısıyla burada üst veri yönetiminin böyle bir etkisi de söz konusu. Yani veri setini tekrardan yayınlamak yerine veya elle bir kişinin burada görev alması yerine bu tür sistemler otomatize edilebilir ve belirli aralıklarla da bu tür harman yayıncıların veya bu tür yapıların kurulması o veri setinin belirli zaman haklarında güncellenmesinde sağlayabilir. Dolayısıyla bazen bu tür yapılar insan hatasından boya doğabilecek hataların da önüne geçme açısından avantajlı olabiliyor. Dolayısıyla açık veri portal yerinde de bu tür yaklaşımları kurulması son derece önemli diye düşünüyorum. Bir Portal’in aynı zamanda bu veriyi dışarıdan alabilir tekrardan sunabilecek bir yapıda veya bir sistemdir. çekebilecek bir yapıda olması hemen önceliklerden birisi belki de bu altyapının açık devlet verisi gibi verilerin özellikle ikinci aşamada genellikle yer alıyor. Bu üst veri yönetimi bağlamında bir mekanizma ile veya bir veri yayınlandığı anda sistem üzerinden bir başka portal aktarılabilmesi bağlamında da önem taşıdığını gözlemleyebiliyoruz. Bunun da örneklerinin net olarak göstermemiz mümkün. Dediğim gibi az önce bir ülkenin ulusal veri portali dinin yüzde 90′ından fazlasını sağlayan bir aracı bir makine olabiliyor. Dolayısı yani bu tür durumlarda da verinin hem sürekliliğini sağlamak hemde doğabilecek hataları azaltmak nispeten hale gelebiliyor diyebilirim.
S. Şıracı: Çok teşekkür ediyorum vermiş olduğunuz bilgiler için. Evet değerli izleyenlerimiz bugün açık kürsünün konuğu Sayın Doçent Doktor Tolga Çakmaktı. Kendisi Hacattepe Üniversitesi Öğretim Üyesi ve aynı zamanda da Dijital Dönüşüm Ofisi’nde de önemli görevleri yerine getirdi. Bugün hem portallere değindik hem de üst verinin kendisini ele almış olduk. Vakit ayırıp bizi izlediğiniz için çok teşekkürler. Evet hocam sizlere de vermiş olduğu bilgiler için gerçekten çok teşekkür ediyoruz. Sağ olunuz.

 

T. Çakmak: Ben teşekkür ediyorum böyle bir platformda yer almaktan da çok mutlu olduğumu belirtmek isterim. Çok teşekkürler.
Paylaşın