Veri seti Açık Erişim

Makine Öğrenmesi Modellerini Kullanarak Akademik Veri Tabanlarına İlişkin Tahminler Oluşturma

Eroğlu, Ertuğrul Burak; Binici, Kasım


DataCite XML

<?xml version='1.0' encoding='utf-8'?>
<resource xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://datacite.org/schema/kernel-4" xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4.1/metadata.xsd">
  <identifier identifierType="DOI">10.48623/aperta.273772</identifier>
  <creators>
    <creator>
      <creatorName>Eroğlu, Ertuğrul Burak</creatorName>
      <givenName>Ertuğrul Burak</givenName>
      <familyName>Eroğlu</familyName>
      <nameIdentifier nameIdentifierScheme="ORCID" schemeURI="http://orcid.org/">0000-0002-6874-5725</nameIdentifier>
      <affiliation>Çankırı Karatekin Üniversitesi</affiliation>
    </creator>
    <creator>
      <creatorName>Binici, Kasım</creatorName>
      <givenName>Kasım</givenName>
      <familyName>Binici</familyName>
      <nameIdentifier nameIdentifierScheme="ORCID" schemeURI="http://orcid.org/">0000-0002-8071-9693</nameIdentifier>
      <affiliation>Çankırı Karatekin Üniversitesi</affiliation>
    </creator>
  </creators>
  <titles>
    <title>Makine Öğrenmesi Modellerini Kullanarak Akademik Veri Tabanlarına İlişkin Tahminler Oluşturma</title>
  </titles>
  <publisher>Aperta</publisher>
  <publicationYear>2024</publicationYear>
  <subjects>
    <subject>Akademik veri tabanı</subject>
    <subject>Veri seti</subject>
    <subject>Makine öğrenmesi</subject>
    <subject>Veri madenciliği</subject>
    <subject>Doğal dil işleme</subject>
  </subjects>
  <dates>
    <date dateType="Issued">2024-07-29</date>
  </dates>
  <resourceType resourceTypeGeneral="Dataset"/>
  <alternateIdentifiers>
    <alternateIdentifier alternateIdentifierType="url">https://aperta.ulakbim.gov.tr/record/273772</alternateIdentifier>
  </alternateIdentifiers>
  <relatedIdentifiers>
    <relatedIdentifier relatedIdentifierType="DOI" relationType="IsVersionOf">10.48623/aperta.273771</relatedIdentifier>
  </relatedIdentifiers>
  <rightsList>
    <rights rightsURI="https://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial</rights>
    <rights rightsURI="info:eu-repo/semantics/openAccess">Open Access</rights>
  </rightsList>
  <descriptions>
    <description descriptionType="Abstract">&lt;p&gt;K&amp;uuml;t&amp;uuml;phane danışma hizmetlerinin makine &amp;ouml;ğrenmesi teknikleriyle otonom bi&amp;ccedil;imde y&amp;uuml;r&amp;uuml;t&amp;uuml;lmesinde kullanışlı makine &amp;ouml;ğrenmesi algoritmalarının belirlenmek istendiği araştırmada, akademik veri tabanlarıyla eğitilen bir makine &amp;ouml;ğrenmesi modelinin, herhangi bir konudaki bilgi kaynağı gereksinimini betimleyen doğal dil sorularına verdiği yanıtların başarım d&amp;uuml;zeyleri &amp;ccedil;eşitli makine &amp;ouml;ğrenmesi algoritmaları &amp;ccedil;er&amp;ccedil;evesinde incelenmek istenmiştir. Modelin eğitimi i&amp;ccedil;in eğitim veri seti,&amp;nbsp;sınanması i&amp;ccedil;in ise bağımsız bir test veri seti oluşturulmuştur.&lt;/p&gt;

&lt;p&gt;Eğitim veri seti: T.C. Millet K&amp;uuml;t&amp;uuml;phanesi&amp;#39;nde listelenen 133 adet veri tabanı, t&amp;uuml;r, dil, format, temel alan, bilim alanı, konular, i&amp;ccedil;erik ve erişim t&amp;uuml;r&amp;uuml; bakımından kayıt altına alınarak tanımlanmıştır. T.C. Millet K&amp;uuml;t&amp;uuml;phanesi&amp;#39;nin veri tabanı listesinin bu &amp;ccedil;alışmada tercih edilmesinin en &amp;ouml;nemli sebepleri &amp;uuml;lkemizdeki en fazla veri tabanına sahip olması ve araştırma kapsamında veri tabanlarında kısıtsız gezinme imk&amp;acirc;nı sunmasıdır. Veri tabanlarının &amp;ouml;z niteliklerinin belirlenmesinde en &amp;ouml;nemli unsur, i&amp;ccedil;erdikleri konuların ve anahtar kelimelerin kapsamlı ve standart bir şekilde saptanmasıdır. Bu ama&amp;ccedil;la, incelenen veri tabanlarının kapsadığı konular &amp;quot;&amp;Uuml;AK 2022 Mart D&amp;ouml;nemi Do&amp;ccedil;entlik Başvurularına Ait Bilim Alanları ve Anahtar Kelimeler&amp;quot; rehberine dayandırılmıştır.&lt;/p&gt;

&lt;p&gt;Test veri seti: Makine &amp;ouml;ğrenmesi modelinin&amp;nbsp;sınanabilmesi i&amp;ccedil;in ihtiya&amp;ccedil; duyulan test veri setinin oluşturulması aşamasında, ilk olarak bu &amp;ccedil;alışmanın y&amp;uuml;r&amp;uuml;t&amp;uuml;c&amp;uuml;s&amp;uuml; tarafından doğal dilin esas alındığı, &amp;ccedil;eşitli ve rastgele kombinasyonlardan oluşan 50 farklı soru kalıbı ortaya &amp;ccedil;ıkarılmıştır. Soru kalıplarının ortaya &amp;ccedil;ıkmasının ardından, &amp;quot;&amp;Uuml;AK 2022 Mart D&amp;ouml;nemi Do&amp;ccedil;entlik Başvurularına ait Bilim Alanları ve Anahtar Kelimeler&amp;quot; isimli rehberdeki anahtar kelimeler, bilim alanlarına g&amp;ouml;re hiyerarşik sırayla MS Excel&amp;#39;e aktarılmış ve bir konu dizini elde edilmiştir.&amp;nbsp;MS Excel &amp;uuml;zerinde oluşturulan konu dizini, &amp;ouml;nceden hazırlanmış olan soru kalıplarına uygulanarak, t&amp;uuml;m konularla ilgili farklı kombinasyonlarda, doğal dil ile oluşturulmuş 7300 sorudan oluşan bir test seti ortaya &amp;ccedil;ıkarılmıştır.&amp;nbsp;Bu sorular, bir araştırmacının herhangi bir konudaki bilgi kaynağı gereksinimini T&amp;uuml;rk&amp;ccedil;e doğal dille ifade etmesi &amp;uuml;zerine kurgulanmıştır.&lt;/p&gt;</description>
  </descriptions>
</resource>
91
51
görüntülenme
indirilme
Tüm sürümler Bu sürüm
Görüntülenme 9191
İndirme 5151
Veri hacmi 19.6 MB19.6 MB
Tekil görüntülenme 7676
Tekil indirme 3737

Alıntı yap