Veri seti Açık Erişim
Eroğlu, Ertuğrul Burak; Binici, Kasım
<?xml version='1.0' encoding='UTF-8'?> <record xmlns="http://www.loc.gov/MARC21/slim"> <leader>00000nmm##2200000uu#4500</leader> <datafield tag="245" ind1=" " ind2=" "> <subfield code="a">Makine Öğrenmesi Modellerini Kullanarak Akademik Veri Tabanlarına İlişkin Tahminler Oluşturma</subfield> </datafield> <datafield tag="024" ind1=" " ind2=" "> <subfield code="a">10.48623/aperta.273772</subfield> <subfield code="2">doi</subfield> </datafield> <controlfield tag="001">273772</controlfield> <datafield tag="520" ind1=" " ind2=" "> <subfield code="a"><p>K&uuml;t&uuml;phane danışma hizmetlerinin makine &ouml;ğrenmesi teknikleriyle otonom bi&ccedil;imde y&uuml;r&uuml;t&uuml;lmesinde kullanışlı makine &ouml;ğrenmesi algoritmalarının belirlenmek istendiği araştırmada, akademik veri tabanlarıyla eğitilen bir makine &ouml;ğrenmesi modelinin, herhangi bir konudaki bilgi kaynağı gereksinimini betimleyen doğal dil sorularına verdiği yanıtların başarım d&uuml;zeyleri &ccedil;eşitli makine &ouml;ğrenmesi algoritmaları &ccedil;er&ccedil;evesinde incelenmek istenmiştir. Modelin eğitimi i&ccedil;in eğitim veri seti,&nbsp;sınanması i&ccedil;in ise bağımsız bir test veri seti oluşturulmuştur.</p> <p>Eğitim veri seti: T.C. Millet K&uuml;t&uuml;phanesi&#39;nde listelenen 133 adet veri tabanı, t&uuml;r, dil, format, temel alan, bilim alanı, konular, i&ccedil;erik ve erişim t&uuml;r&uuml; bakımından kayıt altına alınarak tanımlanmıştır. T.C. Millet K&uuml;t&uuml;phanesi&#39;nin veri tabanı listesinin bu &ccedil;alışmada tercih edilmesinin en &ouml;nemli sebepleri &uuml;lkemizdeki en fazla veri tabanına sahip olması ve araştırma kapsamında veri tabanlarında kısıtsız gezinme imk&acirc;nı sunmasıdır. Veri tabanlarının &ouml;z niteliklerinin belirlenmesinde en &ouml;nemli unsur, i&ccedil;erdikleri konuların ve anahtar kelimelerin kapsamlı ve standart bir şekilde saptanmasıdır. Bu ama&ccedil;la, incelenen veri tabanlarının kapsadığı konular &quot;&Uuml;AK 2022 Mart D&ouml;nemi Do&ccedil;entlik Başvurularına Ait Bilim Alanları ve Anahtar Kelimeler&quot; rehberine dayandırılmıştır.</p> <p>Test veri seti: Makine &ouml;ğrenmesi modelinin&nbsp;sınanabilmesi i&ccedil;in ihtiya&ccedil; duyulan test veri setinin oluşturulması aşamasında, ilk olarak bu &ccedil;alışmanın y&uuml;r&uuml;t&uuml;c&uuml;s&uuml; tarafından doğal dilin esas alındığı, &ccedil;eşitli ve rastgele kombinasyonlardan oluşan 50 farklı soru kalıbı ortaya &ccedil;ıkarılmıştır. Soru kalıplarının ortaya &ccedil;ıkmasının ardından, &quot;&Uuml;AK 2022 Mart D&ouml;nemi Do&ccedil;entlik Başvurularına ait Bilim Alanları ve Anahtar Kelimeler&quot; isimli rehberdeki anahtar kelimeler, bilim alanlarına g&ouml;re hiyerarşik sırayla MS Excel&#39;e aktarılmış ve bir konu dizini elde edilmiştir.&nbsp;MS Excel &uuml;zerinde oluşturulan konu dizini, &ouml;nceden hazırlanmış olan soru kalıplarına uygulanarak, t&uuml;m konularla ilgili farklı kombinasyonlarda, doğal dil ile oluşturulmuş 7300 sorudan oluşan bir test seti ortaya &ccedil;ıkarılmıştır.&nbsp;Bu sorular, bir araştırmacının herhangi bir konudaki bilgi kaynağı gereksinimini T&uuml;rk&ccedil;e doğal dille ifade etmesi &uuml;zerine kurgulanmıştır.</p></subfield> </datafield> <datafield tag="650" ind1="1" ind2="7"> <subfield code="2">opendefinition.org</subfield> <subfield code="a">cc-by</subfield> </datafield> <datafield tag="700" ind1=" " ind2=" "> <subfield code="0">(orcid)0000-0002-8071-9693</subfield> <subfield code="u">Çankırı Karatekin Üniversitesi</subfield> <subfield code="a">Binici, Kasım</subfield> </datafield> <datafield tag="980" ind1=" " ind2=" "> <subfield code="a">dataset</subfield> </datafield> <datafield tag="542" ind1=" " ind2=" "> <subfield code="l">open</subfield> </datafield> <datafield tag="100" ind1=" " ind2=" "> <subfield code="0">(orcid)0000-0002-6874-5725</subfield> <subfield code="u">Çankırı Karatekin Üniversitesi</subfield> <subfield code="a">Eroğlu, Ertuğrul Burak</subfield> </datafield> <datafield tag="653" ind1=" " ind2=" "> <subfield code="a">Akademik veri tabanı</subfield> </datafield> <datafield tag="653" ind1=" " ind2=" "> <subfield code="a">Veri seti</subfield> </datafield> <datafield tag="653" ind1=" " ind2=" "> <subfield code="a">Makine öğrenmesi</subfield> </datafield> <datafield tag="653" ind1=" " ind2=" "> <subfield code="a">Veri madenciliği</subfield> </datafield> <datafield tag="653" ind1=" " ind2=" "> <subfield code="a">Doğal dil işleme</subfield> </datafield> <datafield tag="260" ind1=" " ind2=" "> <subfield code="c">2024-07-29</subfield> </datafield> <controlfield tag="005">20240904135624.0</controlfield> <datafield tag="773" ind1=" " ind2=" "> <subfield code="n">doi</subfield> <subfield code="a">10.48623/aperta.273771</subfield> <subfield code="i">isVersionOf</subfield> </datafield> <datafield tag="909" ind1="C" ind2="O"> <subfield code="o">oai:aperta.ulakbim.gov.tr:273772</subfield> </datafield> <datafield tag="856" ind1="4" ind2=" "> <subfield code="z">md5:8b512c6142e9bc9536c44e2ec8af6f38</subfield> <subfield code="s">520267</subfield> <subfield code="u">https://aperta.ulakbim.gov.trrecord/273772/files/egitimveriseti-veritabanikatalog.xlsx</subfield> </datafield> <datafield tag="856" ind1="4" ind2=" "> <subfield code="z">md5:6d41d9ad4dc451869e5163e0ecbf7f11</subfield> <subfield code="s">113974</subfield> <subfield code="u">https://aperta.ulakbim.gov.trrecord/273772/files/testseti-dogaldilsorular.xlsx</subfield> </datafield> <datafield tag="540" ind1=" " ind2=" "> <subfield code="u">https://creativecommons.org/licenses/by-nc/4.0/</subfield> <subfield code="a">Creative Commons Attribution-NonCommercial</subfield> </datafield> </record>
Tüm sürümler | Bu sürüm | |
---|---|---|
Görüntülenme | 91 | 91 |
İndirme | 51 | 51 |
Veri hacmi | 19.6 MB | 19.6 MB |
Tekil görüntülenme | 76 | 76 |
Tekil indirme | 37 | 37 |