Contextual Combinatorial Volatile Multi-armed Bandit with Adaptive Discretization

Nika, Andi; Elahi, Sepehr; Tekin, Cem

doi:10.81043/aperta.10923

1 Ocak 2020 Konferans bildirisi Açık Erişim

Contextual Combinatorial Volatile Multi-armed Bandit with Adaptive Discretization

Nika, Andi; Elahi, Sepehr; Tekin, Cem

MARC21 XML

<?xml version='1.0' encoding='UTF-8'?>
<record xmlns="http://www.loc.gov/MARC21/slim">
  <leader>00000nam##2200000uu#4500</leader>
  <datafield tag="245" ind1=" " ind2=" ">
    <subfield code="a">Contextual Combinatorial Volatile Multi-armed Bandit with Adaptive Discretization</subfield>
  </datafield>
  <datafield tag="024" ind1=" " ind2=" ">
    <subfield code="a">10.81043/aperta.10923</subfield>
    <subfield code="2">doi</subfield>
  </datafield>
  <controlfield tag="001">10923</controlfield>
  <datafield tag="980" ind1=" " ind2=" ">
    <subfield code="a">user-tubitak-destekli-proje-yayinlari</subfield>
  </datafield>
  <datafield tag="520" ind1=" " ind2=" ">
    <subfield code="a">We consider contextual combinatorial volatile multi-armed bandit (CCV-MAB), in which at each round, the learner observes a set of available base arms and their contexts, and then, selects a super arm that contains K base arms in order to maximize its cumulative reward. Under the semi-bandit feedback setting and assuming that the contexts lie in a space X endowed with the Euclidean norm and that the expected base arm outcomes (expected rewards) are Lipschitz continuous in the contexts (expected base arm outcomes), we propose an algorithm called Adaptive Contextual Combinatorial Upper Confidence Bound (ACC-UCB). This algorithm, which adaptively discretizes X to form estimates of base arm outcomes and uses an a -approximation oracle as a subroutine to select a super arm in each round, achieves (O) over tilde (T-)(((D) over bar +1)/((D) over bar +2)+epsilon) regret for any epsilon &amp;gt; 0, where D represents the approximate optimality dimension related to X. This dimension captures both the benignness of the base arm arrivals and the structure of the expected reward. In addition, we provide a recipe for obtaining more optimistic regret bounds by taking into account the volatility of the base arms and show that ACC-UCB achieves significant performance gains compared to the state-of-the-art for worker selection in mobile crowdsourcing.</subfield>
  </datafield>
  <datafield tag="650" ind1="1" ind2="7">
    <subfield code="2">opendefinition.org</subfield>
    <subfield code="a">cc-by</subfield>
  </datafield>
  <datafield tag="700" ind1=" " ind2=" ">
    <subfield code="u">Bilkent Univ, Dept Elect &amp; Elect Engn, Ankara, Turkey</subfield>
    <subfield code="a">Elahi, Sepehr</subfield>
  </datafield>
  <datafield tag="700" ind1=" " ind2=" ">
    <subfield code="u">Bilkent Univ, Dept Elect &amp; Elect Engn, Ankara, Turkey</subfield>
    <subfield code="a">Tekin, Cem</subfield>
  </datafield>
  <datafield tag="980" ind1=" " ind2=" ">
    <subfield code="b">conferencepaper</subfield>
    <subfield code="a">publication</subfield>
  </datafield>
  <datafield tag="542" ind1=" " ind2=" ">
    <subfield code="l">open</subfield>
  </datafield>
  <datafield tag="100" ind1=" " ind2=" ">
    <subfield code="u">Bilkent Univ, Dept Elect &amp; Elect Engn, Ankara, Turkey</subfield>
    <subfield code="a">Nika, Andi</subfield>
  </datafield>
  <datafield tag="711" ind1=" " ind2=" ">
    <subfield code="a">INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND STATISTICS, VOL 108</subfield>
  </datafield>
  <datafield tag="260" ind1=" " ind2=" ">
    <subfield code="c">2020-01-01</subfield>
  </datafield>
  <controlfield tag="005">20210315073308.0</controlfield>
  <datafield tag="773" ind1=" " ind2=" ">
    <subfield code="n">doi</subfield>
    <subfield code="a">10.81043/aperta.10922</subfield>
    <subfield code="i">isVersionOf</subfield>
  </datafield>
  <datafield tag="909" ind1="C" ind2="O">
    <subfield code="o">oai:zenodo.org:10923</subfield>
    <subfield code="p">user-tubitak-destekli-proje-yayinlari</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2=" ">
    <subfield code="z">md5:b811a34ec4a5a5e8f697757b991fd095</subfield>
    <subfield code="s">198</subfield>
    <subfield code="u">https://aperta.ulakbim.gov.trrecord/10923/files/bib-6a374ca0-fd89-4900-b4c6-8df09861910d.txt</subfield>
  </datafield>
  <datafield tag="540" ind1=" " ind2=" ">
    <subfield code="u">http://www.opendefinition.org/licenses/cc-by</subfield>
    <subfield code="a">Creative Commons Attribution</subfield>
  </datafield>
</record>

görüntülenme

indirilme

Daha fazla ayrıntı...

Görüntülenme	30
İndirme	5
Veri hacmi	990 Bytes
Tekil görüntülenme	30
Tekil indirme	5

Kayıt Bilgileri

Yayınlanma tarihi:: 01/01/2020
Konferans Bilgileri:: INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND STATISTICS, VOL 108
Lisans:: Creative Commons Attribution

Contextual Combinatorial Volatile Multi-armed Bandit with Adaptive Discretization

Contextual Combinatorial Volatile Multi-armed Bandit with Adaptive Discretization

MARC21 XML

Kayıt Bilgileri

Alıntı yap

Paylaş

Dışa aktar

TÜBİTAK ULAKBİM

İLETİŞİM