Veri seti Açık Erişim
Eroğlu, Ertuğrul Burak; Binici, Kasım
<?xml version='1.0' encoding='utf-8'?> <resource xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://datacite.org/schema/kernel-4" xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4.1/metadata.xsd"> <identifier identifierType="DOI">10.48623/aperta.273772</identifier> <creators> <creator> <creatorName>Eroğlu, Ertuğrul Burak</creatorName> <givenName>Ertuğrul Burak</givenName> <familyName>Eroğlu</familyName> <nameIdentifier nameIdentifierScheme="ORCID" schemeURI="http://orcid.org/">0000-0002-6874-5725</nameIdentifier> <affiliation>Çankırı Karatekin Üniversitesi</affiliation> </creator> <creator> <creatorName>Binici, Kasım</creatorName> <givenName>Kasım</givenName> <familyName>Binici</familyName> <nameIdentifier nameIdentifierScheme="ORCID" schemeURI="http://orcid.org/">0000-0002-8071-9693</nameIdentifier> <affiliation>Çankırı Karatekin Üniversitesi</affiliation> </creator> </creators> <titles> <title>Makine Öğrenmesi Modellerini Kullanarak Akademik Veri Tabanlarına İlişkin Tahminler Oluşturma</title> </titles> <publisher>Aperta</publisher> <publicationYear>2024</publicationYear> <subjects> <subject>Akademik veri tabanı</subject> <subject>Veri seti</subject> <subject>Makine öğrenmesi</subject> <subject>Veri madenciliği</subject> <subject>Doğal dil işleme</subject> </subjects> <dates> <date dateType="Issued">2024-07-29</date> </dates> <resourceType resourceTypeGeneral="Dataset"/> <alternateIdentifiers> <alternateIdentifier alternateIdentifierType="url">https://aperta.ulakbim.gov.tr/record/273772</alternateIdentifier> </alternateIdentifiers> <relatedIdentifiers> <relatedIdentifier relatedIdentifierType="DOI" relationType="IsVersionOf">10.48623/aperta.273771</relatedIdentifier> </relatedIdentifiers> <rightsList> <rights rightsURI="https://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial</rights> <rights rightsURI="info:eu-repo/semantics/openAccess">Open Access</rights> </rightsList> <descriptions> <description descriptionType="Abstract"><p>K&uuml;t&uuml;phane danışma hizmetlerinin makine &ouml;ğrenmesi teknikleriyle otonom bi&ccedil;imde y&uuml;r&uuml;t&uuml;lmesinde kullanışlı makine &ouml;ğrenmesi algoritmalarının belirlenmek istendiği araştırmada, akademik veri tabanlarıyla eğitilen bir makine &ouml;ğrenmesi modelinin, herhangi bir konudaki bilgi kaynağı gereksinimini betimleyen doğal dil sorularına verdiği yanıtların başarım d&uuml;zeyleri &ccedil;eşitli makine &ouml;ğrenmesi algoritmaları &ccedil;er&ccedil;evesinde incelenmek istenmiştir. Modelin eğitimi i&ccedil;in eğitim veri seti,&nbsp;sınanması i&ccedil;in ise bağımsız bir test veri seti oluşturulmuştur.</p> <p>Eğitim veri seti: T.C. Millet K&uuml;t&uuml;phanesi&#39;nde listelenen 133 adet veri tabanı, t&uuml;r, dil, format, temel alan, bilim alanı, konular, i&ccedil;erik ve erişim t&uuml;r&uuml; bakımından kayıt altına alınarak tanımlanmıştır. T.C. Millet K&uuml;t&uuml;phanesi&#39;nin veri tabanı listesinin bu &ccedil;alışmada tercih edilmesinin en &ouml;nemli sebepleri &uuml;lkemizdeki en fazla veri tabanına sahip olması ve araştırma kapsamında veri tabanlarında kısıtsız gezinme imk&acirc;nı sunmasıdır. Veri tabanlarının &ouml;z niteliklerinin belirlenmesinde en &ouml;nemli unsur, i&ccedil;erdikleri konuların ve anahtar kelimelerin kapsamlı ve standart bir şekilde saptanmasıdır. Bu ama&ccedil;la, incelenen veri tabanlarının kapsadığı konular &quot;&Uuml;AK 2022 Mart D&ouml;nemi Do&ccedil;entlik Başvurularına Ait Bilim Alanları ve Anahtar Kelimeler&quot; rehberine dayandırılmıştır.</p> <p>Test veri seti: Makine &ouml;ğrenmesi modelinin&nbsp;sınanabilmesi i&ccedil;in ihtiya&ccedil; duyulan test veri setinin oluşturulması aşamasında, ilk olarak bu &ccedil;alışmanın y&uuml;r&uuml;t&uuml;c&uuml;s&uuml; tarafından doğal dilin esas alındığı, &ccedil;eşitli ve rastgele kombinasyonlardan oluşan 50 farklı soru kalıbı ortaya &ccedil;ıkarılmıştır. Soru kalıplarının ortaya &ccedil;ıkmasının ardından, &quot;&Uuml;AK 2022 Mart D&ouml;nemi Do&ccedil;entlik Başvurularına ait Bilim Alanları ve Anahtar Kelimeler&quot; isimli rehberdeki anahtar kelimeler, bilim alanlarına g&ouml;re hiyerarşik sırayla MS Excel&#39;e aktarılmış ve bir konu dizini elde edilmiştir.&nbsp;MS Excel &uuml;zerinde oluşturulan konu dizini, &ouml;nceden hazırlanmış olan soru kalıplarına uygulanarak, t&uuml;m konularla ilgili farklı kombinasyonlarda, doğal dil ile oluşturulmuş 7300 sorudan oluşan bir test seti ortaya &ccedil;ıkarılmıştır.&nbsp;Bu sorular, bir araştırmacının herhangi bir konudaki bilgi kaynağı gereksinimini T&uuml;rk&ccedil;e doğal dille ifade etmesi &uuml;zerine kurgulanmıştır.</p></description> </descriptions> </resource>
Tüm sürümler | Bu sürüm | |
---|---|---|
Görüntülenme | 91 | 91 |
İndirme | 51 | 51 |
Veri hacmi | 19.6 MB | 19.6 MB |
Tekil görüntülenme | 76 | 76 |
Tekil indirme | 37 | 37 |