/ en / Traditional / help

Beats Biblionetz - Begriffe

reinforcement learning

iconBiblioMap Dies ist der Versuch, gewisse Zusammenhänge im Biblionetz graphisch darzustellen. Könnte noch besser werden, aber immerhin ein Anfang!

Diese Grafik ist nur im SVG-Format verfügbar. Dieses Format wird vom verwendeteten Browser offenbar nicht unterstützt.

Diese SVG-Grafik fensterfüllend anzeigen

iconSynonyme

reinforcement learning, verstärkendes Lernen

iconDefinitionen

Life 3.0Basic reinforcement learning is a classic machine learning technique inspired by behaviorist psychology, where getting a positive reward increases your tendency to do something again and vice versa.
Von Max Tegmark im Buch Life 3.0 (2017) im Text The Near Future: Breakthroughs, Bugs, Laws, Weapons and Jobs
Gerd GigerenzerDas verstärkte Lernen (reinforcement learning), findet etwa bei Spielen wie Go statt, bei denen das Netz nicht nach jedem Zug Feedback erhält, sondern erst am Ende des Spiels. In diesem Fall kennt das Netz nur die Spielregeln und das Ziel, muss also einen eigenen Weg finden, um dorthin zu gelangen.
Von Gerd Gigerenzer im Buch Klick (2021) im Text Sind selbstfahrende Autos zum Greifen nah?
Herausforderungen der künstlichen IntelligenzBeim bestärkenden Lernen lernt das System statt aus Daten durch Interaktion mit seiner Umgebung (typischerweise in einer Computer-Simulation). Das System probiert eigenständig unterschiedliche Lösungswege und erhält aus seiner Umwelt Rückmeldungen (Feedbacks), die ein bestimmtes Vorgehen belohnen oder bestrafen. Dabei wird nicht vorgezeigt, welche Aktion in welcher Situation die beste ist. Vielmehr werden durch wiederholte Handlungen und Rückmeldungen die Auswirkungen von Handlungen in bestimmten Situationen erlernt.
Von Interdepartementale Arbeitsgruppe künstliche Intelligenz im Buch Herausforderungen der künstlichen Intelligenz (2019) im Text Anhang 2: Maschinelles Lernen

iconBemerkungen

Gerd GigerenzerEin Algorithmus, der entwickelt wurde, um Tetris zu spielen, lernte einfach, das Spiel anzuhalten, um eine Niederlage zu vermeiden.
Von Gerd Gigerenzer im Buch Klick (2021) im Text Sind selbstfahrende Autos zum Greifen nah?
Reinforcement-Learning-Algorithmen können auch allein anhand von rohen Bilddaten Erfolg versprechende Strategien erlernen. Beispielsweise erlernte das DQN-System‌ von DeepMind 49 verschiedene Atari-Videospiele von Grund auf, darunter Pong, Freeway und Space Invaders‌‌‌‌‌.
Von Stuart Russell im Text Natürliche und künstliche Intelligenz

iconVerwandte Objeke

icon
Verwandte Begriffe
(co-word occurance)
supervised learning(0.24), unsupervised learning(0.19), RLHF (Reinforcement Learning from Human Feedback)(0.1), deep learning(0.06), machine learning(0.03), symbolische künstliche Intelligenz (GOFAI)(0.03)

iconHäufig co-zitierte Personen

Moritz Hardt Moritz
Hardt
Tom Rodden Tom
Rodden
Yvonne Rogers Yvonne
Rogers
Alexandra Poulovasillis Alexandra
Poulovasillis
Jürgen Schmidhuber Jürgen
Schmidhuber
Arvind Narayanan Arvind
Narayanan
Abigail Sellen Abigail
Sellen
Richard Harper Richard
Harper
Wayne Holmes Wayne
Holmes
Ian Roberts Ian
Roberts
Whitney Zhang Whitney
Zhang
Shakked Noy Shakked
Noy
Jeffrey Watumull Jeffrey
Watumull
Solon Barocas Solon
Barocas
Gloria Mark Gloria
Mark
OpenAI OpenAI
Kevin Roose Kevin
Roose
Manolis Mavrikis Manolis
Mavrikis
Angelina McMillan-Major Angelina
McMillan-Major
Shmargaret Shmitchell Shmargaret
Shmitchell
Emily M. Bender Emily M.
Bender

iconStatistisches Begriffsnetz  Dies ist eine graphische Darstellung derjenigen Begriffe, die häufig gleichzeitig mit dem Hauptbegriff erwähnt werden (Cozitation).

iconVorträge von Beat mit Bezug

iconZitationsgraph

Diese Grafik ist nur im SVG-Format verfügbar. Dieses Format wird vom verwendeteten Browser offenbar nicht unterstützt.

Diese SVG-Grafik fensterfüllend anzeigen

iconZeitleiste

icon36 Erwähnungen  Dies ist eine nach Erscheinungsjahr geordnete Liste aller im Biblionetz vorhandenen Werke, die das ausgewählte Thema behandeln.

iconAnderswo suchen  Auch im Biblionetz finden Sie nicht alles. Aus diesem Grund bietet das Biblionetz bereits ausgefüllte Suchformulare für verschiedene Suchdienste an. Biblionetztreffer werden dabei ausgeschlossen.

iconBiblionetz-History Dies ist eine graphische Darstellung, wann wie viele Verweise von und zu diesem Objekt ins Biblionetz eingetragen wurden und wie oft die Seite abgerufen wurde.