Veri seti Açık Erişim
Eroğlu, Ertuğrul Burak;
Binici, Kasım
<?xml version='1.0' encoding='utf-8'?>
<resource xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://datacite.org/schema/kernel-4" xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4.1/metadata.xsd">
<identifier identifierType="DOI">10.48623/aperta.273772</identifier>
<creators>
<creator>
<creatorName>Eroğlu, Ertuğrul Burak</creatorName>
<givenName>Ertuğrul Burak</givenName>
<familyName>Eroğlu</familyName>
<nameIdentifier nameIdentifierScheme="ORCID" schemeURI="http://orcid.org/">0000-0002-6874-5725</nameIdentifier>
<affiliation>Çankırı Karatekin Üniversitesi</affiliation>
</creator>
<creator>
<creatorName>Binici, Kasım</creatorName>
<givenName>Kasım</givenName>
<familyName>Binici</familyName>
<nameIdentifier nameIdentifierScheme="ORCID" schemeURI="http://orcid.org/">0000-0002-8071-9693</nameIdentifier>
<affiliation>Çankırı Karatekin Üniversitesi</affiliation>
</creator>
</creators>
<titles>
<title>Makine Öğrenmesi Modellerini Kullanarak Akademik Veri Tabanlarına İlişkin Tahminler Oluşturma</title>
</titles>
<publisher>Aperta</publisher>
<publicationYear>2024</publicationYear>
<subjects>
<subject>Akademik veri tabanı</subject>
<subject>Veri seti</subject>
<subject>Makine öğrenmesi</subject>
<subject>Veri madenciliği</subject>
<subject>Doğal dil işleme</subject>
</subjects>
<dates>
<date dateType="Issued">2024-07-29</date>
</dates>
<resourceType resourceTypeGeneral="Dataset"/>
<alternateIdentifiers>
<alternateIdentifier alternateIdentifierType="url">https://aperta.ulakbim.gov.tr/record/273772</alternateIdentifier>
</alternateIdentifiers>
<relatedIdentifiers>
<relatedIdentifier relatedIdentifierType="DOI" relationType="IsVersionOf">10.48623/aperta.273771</relatedIdentifier>
</relatedIdentifiers>
<rightsList>
<rights rightsURI="https://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial</rights>
<rights rightsURI="info:eu-repo/semantics/openAccess">Open Access</rights>
</rightsList>
<descriptions>
<description descriptionType="Abstract"><p>K&uuml;t&uuml;phane danışma hizmetlerinin makine &ouml;ğrenmesi teknikleriyle otonom bi&ccedil;imde y&uuml;r&uuml;t&uuml;lmesinde kullanışlı makine &ouml;ğrenmesi algoritmalarının belirlenmek istendiği araştırmada, akademik veri tabanlarıyla eğitilen bir makine &ouml;ğrenmesi modelinin, herhangi bir konudaki bilgi kaynağı gereksinimini betimleyen doğal dil sorularına verdiği yanıtların başarım d&uuml;zeyleri &ccedil;eşitli makine &ouml;ğrenmesi algoritmaları &ccedil;er&ccedil;evesinde incelenmek istenmiştir. Modelin eğitimi i&ccedil;in eğitim veri seti,&nbsp;sınanması i&ccedil;in ise bağımsız bir test veri seti oluşturulmuştur.</p>
<p>Eğitim veri seti: T.C. Millet K&uuml;t&uuml;phanesi&#39;nde listelenen 133 adet veri tabanı, t&uuml;r, dil, format, temel alan, bilim alanı, konular, i&ccedil;erik ve erişim t&uuml;r&uuml; bakımından kayıt altına alınarak tanımlanmıştır. T.C. Millet K&uuml;t&uuml;phanesi&#39;nin veri tabanı listesinin bu &ccedil;alışmada tercih edilmesinin en &ouml;nemli sebepleri &uuml;lkemizdeki en fazla veri tabanına sahip olması ve araştırma kapsamında veri tabanlarında kısıtsız gezinme imk&acirc;nı sunmasıdır. Veri tabanlarının &ouml;z niteliklerinin belirlenmesinde en &ouml;nemli unsur, i&ccedil;erdikleri konuların ve anahtar kelimelerin kapsamlı ve standart bir şekilde saptanmasıdır. Bu ama&ccedil;la, incelenen veri tabanlarının kapsadığı konular &quot;&Uuml;AK 2022 Mart D&ouml;nemi Do&ccedil;entlik Başvurularına Ait Bilim Alanları ve Anahtar Kelimeler&quot; rehberine dayandırılmıştır.</p>
<p>Test veri seti: Makine &ouml;ğrenmesi modelinin&nbsp;sınanabilmesi i&ccedil;in ihtiya&ccedil; duyulan test veri setinin oluşturulması aşamasında, ilk olarak bu &ccedil;alışmanın y&uuml;r&uuml;t&uuml;c&uuml;s&uuml; tarafından doğal dilin esas alındığı, &ccedil;eşitli ve rastgele kombinasyonlardan oluşan 50 farklı soru kalıbı ortaya &ccedil;ıkarılmıştır. Soru kalıplarının ortaya &ccedil;ıkmasının ardından, &quot;&Uuml;AK 2022 Mart D&ouml;nemi Do&ccedil;entlik Başvurularına ait Bilim Alanları ve Anahtar Kelimeler&quot; isimli rehberdeki anahtar kelimeler, bilim alanlarına g&ouml;re hiyerarşik sırayla MS Excel&#39;e aktarılmış ve bir konu dizini elde edilmiştir.&nbsp;MS Excel &uuml;zerinde oluşturulan konu dizini, &ouml;nceden hazırlanmış olan soru kalıplarına uygulanarak, t&uuml;m konularla ilgili farklı kombinasyonlarda, doğal dil ile oluşturulmuş 7300 sorudan oluşan bir test seti ortaya &ccedil;ıkarılmıştır.&nbsp;Bu sorular, bir araştırmacının herhangi bir konudaki bilgi kaynağı gereksinimini T&uuml;rk&ccedil;e doğal dille ifade etmesi &uuml;zerine kurgulanmıştır.</p></description>
</descriptions>
</resource>
| Tüm sürümler | Bu sürüm | |
|---|---|---|
| Görüntülenme | 124 | 126 |
| İndirme | 68 | 68 |
| Veri hacmi | 27.3 MB | 27.3 MB |
| Tekil görüntülenme | 103 | 104 |
| Tekil indirme | 51 | 51 |