Veri seti Açık Erişim

Makine Öğrenmesi Modellerini Kullanarak Akademik Veri Tabanlarına İlişkin Tahminler Oluşturma

Eroğlu, Ertuğrul Burak; Binici, Kasım


MARC21 XML

<?xml version='1.0' encoding='UTF-8'?>
<record xmlns="http://www.loc.gov/MARC21/slim">
  <leader>00000nmm##2200000uu#4500</leader>
  <datafield tag="245" ind1=" " ind2=" ">
    <subfield code="a">Makine Öğrenmesi Modellerini Kullanarak Akademik Veri Tabanlarına İlişkin Tahminler Oluşturma</subfield>
  </datafield>
  <datafield tag="024" ind1=" " ind2=" ">
    <subfield code="a">10.48623/aperta.273772</subfield>
    <subfield code="2">doi</subfield>
  </datafield>
  <controlfield tag="001">273772</controlfield>
  <datafield tag="520" ind1=" " ind2=" ">
    <subfield code="a">&lt;p&gt;K&amp;uuml;t&amp;uuml;phane danışma hizmetlerinin makine &amp;ouml;ğrenmesi teknikleriyle otonom bi&amp;ccedil;imde y&amp;uuml;r&amp;uuml;t&amp;uuml;lmesinde kullanışlı makine &amp;ouml;ğrenmesi algoritmalarının belirlenmek istendiği araştırmada, akademik veri tabanlarıyla eğitilen bir makine &amp;ouml;ğrenmesi modelinin, herhangi bir konudaki bilgi kaynağı gereksinimini betimleyen doğal dil sorularına verdiği yanıtların başarım d&amp;uuml;zeyleri &amp;ccedil;eşitli makine &amp;ouml;ğrenmesi algoritmaları &amp;ccedil;er&amp;ccedil;evesinde incelenmek istenmiştir. Modelin eğitimi i&amp;ccedil;in eğitim veri seti,&amp;nbsp;sınanması i&amp;ccedil;in ise bağımsız bir test veri seti oluşturulmuştur.&lt;/p&gt;

&lt;p&gt;Eğitim veri seti: T.C. Millet K&amp;uuml;t&amp;uuml;phanesi&amp;#39;nde listelenen 133 adet veri tabanı, t&amp;uuml;r, dil, format, temel alan, bilim alanı, konular, i&amp;ccedil;erik ve erişim t&amp;uuml;r&amp;uuml; bakımından kayıt altına alınarak tanımlanmıştır. T.C. Millet K&amp;uuml;t&amp;uuml;phanesi&amp;#39;nin veri tabanı listesinin bu &amp;ccedil;alışmada tercih edilmesinin en &amp;ouml;nemli sebepleri &amp;uuml;lkemizdeki en fazla veri tabanına sahip olması ve araştırma kapsamında veri tabanlarında kısıtsız gezinme imk&amp;acirc;nı sunmasıdır. Veri tabanlarının &amp;ouml;z niteliklerinin belirlenmesinde en &amp;ouml;nemli unsur, i&amp;ccedil;erdikleri konuların ve anahtar kelimelerin kapsamlı ve standart bir şekilde saptanmasıdır. Bu ama&amp;ccedil;la, incelenen veri tabanlarının kapsadığı konular &amp;quot;&amp;Uuml;AK 2022 Mart D&amp;ouml;nemi Do&amp;ccedil;entlik Başvurularına Ait Bilim Alanları ve Anahtar Kelimeler&amp;quot; rehberine dayandırılmıştır.&lt;/p&gt;

&lt;p&gt;Test veri seti: Makine &amp;ouml;ğrenmesi modelinin&amp;nbsp;sınanabilmesi i&amp;ccedil;in ihtiya&amp;ccedil; duyulan test veri setinin oluşturulması aşamasında, ilk olarak bu &amp;ccedil;alışmanın y&amp;uuml;r&amp;uuml;t&amp;uuml;c&amp;uuml;s&amp;uuml; tarafından doğal dilin esas alındığı, &amp;ccedil;eşitli ve rastgele kombinasyonlardan oluşan 50 farklı soru kalıbı ortaya &amp;ccedil;ıkarılmıştır. Soru kalıplarının ortaya &amp;ccedil;ıkmasının ardından, &amp;quot;&amp;Uuml;AK 2022 Mart D&amp;ouml;nemi Do&amp;ccedil;entlik Başvurularına ait Bilim Alanları ve Anahtar Kelimeler&amp;quot; isimli rehberdeki anahtar kelimeler, bilim alanlarına g&amp;ouml;re hiyerarşik sırayla MS Excel&amp;#39;e aktarılmış ve bir konu dizini elde edilmiştir.&amp;nbsp;MS Excel &amp;uuml;zerinde oluşturulan konu dizini, &amp;ouml;nceden hazırlanmış olan soru kalıplarına uygulanarak, t&amp;uuml;m konularla ilgili farklı kombinasyonlarda, doğal dil ile oluşturulmuş 7300 sorudan oluşan bir test seti ortaya &amp;ccedil;ıkarılmıştır.&amp;nbsp;Bu sorular, bir araştırmacının herhangi bir konudaki bilgi kaynağı gereksinimini T&amp;uuml;rk&amp;ccedil;e doğal dille ifade etmesi &amp;uuml;zerine kurgulanmıştır.&lt;/p&gt;</subfield>
  </datafield>
  <datafield tag="650" ind1="1" ind2="7">
    <subfield code="2">opendefinition.org</subfield>
    <subfield code="a">cc-by</subfield>
  </datafield>
  <datafield tag="700" ind1=" " ind2=" ">
    <subfield code="0">(orcid)0000-0002-8071-9693</subfield>
    <subfield code="u">Çankırı Karatekin Üniversitesi</subfield>
    <subfield code="a">Binici, Kasım</subfield>
  </datafield>
  <datafield tag="980" ind1=" " ind2=" ">
    <subfield code="a">dataset</subfield>
  </datafield>
  <datafield tag="542" ind1=" " ind2=" ">
    <subfield code="l">open</subfield>
  </datafield>
  <datafield tag="100" ind1=" " ind2=" ">
    <subfield code="0">(orcid)0000-0002-6874-5725</subfield>
    <subfield code="u">Çankırı Karatekin Üniversitesi</subfield>
    <subfield code="a">Eroğlu, Ertuğrul Burak</subfield>
  </datafield>
  <datafield tag="653" ind1=" " ind2=" ">
    <subfield code="a">Akademik veri tabanı</subfield>
  </datafield>
  <datafield tag="653" ind1=" " ind2=" ">
    <subfield code="a">Veri seti</subfield>
  </datafield>
  <datafield tag="653" ind1=" " ind2=" ">
    <subfield code="a">Makine öğrenmesi</subfield>
  </datafield>
  <datafield tag="653" ind1=" " ind2=" ">
    <subfield code="a">Veri madenciliği</subfield>
  </datafield>
  <datafield tag="653" ind1=" " ind2=" ">
    <subfield code="a">Doğal dil işleme</subfield>
  </datafield>
  <datafield tag="260" ind1=" " ind2=" ">
    <subfield code="c">2024-07-29</subfield>
  </datafield>
  <controlfield tag="005">20240904135624.0</controlfield>
  <datafield tag="773" ind1=" " ind2=" ">
    <subfield code="n">doi</subfield>
    <subfield code="a">10.48623/aperta.273771</subfield>
    <subfield code="i">isVersionOf</subfield>
  </datafield>
  <datafield tag="909" ind1="C" ind2="O">
    <subfield code="o">oai:aperta.ulakbim.gov.tr:273772</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2=" ">
    <subfield code="z">md5:8b512c6142e9bc9536c44e2ec8af6f38</subfield>
    <subfield code="s">520267</subfield>
    <subfield code="u">https://aperta.ulakbim.gov.trrecord/273772/files/egitimveriseti-veritabanikatalog.xlsx</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2=" ">
    <subfield code="z">md5:6d41d9ad4dc451869e5163e0ecbf7f11</subfield>
    <subfield code="s">113974</subfield>
    <subfield code="u">https://aperta.ulakbim.gov.trrecord/273772/files/testseti-dogaldilsorular.xlsx</subfield>
  </datafield>
  <datafield tag="540" ind1=" " ind2=" ">
    <subfield code="u">https://creativecommons.org/licenses/by-nc/4.0/</subfield>
    <subfield code="a">Creative Commons Attribution-NonCommercial</subfield>
  </datafield>
</record>
91
51
görüntülenme
indirilme
Tüm sürümler Bu sürüm
Görüntülenme 9191
İndirme 5151
Veri hacmi 19.6 MB19.6 MB
Tekil görüntülenme 7676
Tekil indirme 3737

Alıntı yap