Was ist ML?

# Was ist ML?
### Maschinelles Lernen mit R <a href='https://therbootcamp.github.io'> The R Bootcamp </a> <a href='https://therbootcamp.github.io/ML_2020Oct/'> </a>  <a href='https://therbootcamp.github.io'> </a>  <a href='mailto:therbootcamp@gmail.com'> </a>  <a href='https://www.linkedin.com/company/basel-r-bootcamp/'> </a>
### Oktober 2020

---

<div class="my-footer">
 
 
 <img src="https://raw.githubusercontent.com/therbootcamp/therbootcamp.github.io/master/_sessions/_image/by-sa.png" height=14 style="vertical-align: middle"/>
 
 <a href="https://therbootcamp.github.io/">
 
 
 www.therbootcamp.com
 
 
 </a>
 <a href="https://therbootcamp.github.io/">
 
 Maschinelles Lernen mit R | Oktober 2020
 
 </a>
 
 </div>

---

<h1><a>Was denkt Du?</a></h1>

Nicht Googlen :)

---

# Was ist maschinelles Lernen?

<ul>
 <li class="m1">Maschinelles Lernen ist...</li> 
 <ul class="level">
 <li>...ein <high>Bereich der künstlichen Intelligenz</high>...</li> 
 <li>...der mittels <high>statistischer Methoden</high>...</li> 
 <li>...es Computern ermöglicht zu <high>lernen</high>...</li> 
 <li>...d.h., fortwährend die eigene <high>Leistung</high> in (spezifischen) Aufgaben verbessert...</li> 
 <li>...<high>ohne explizit programmiert</high> worden zu sein.</li>
 </ul>
</ul>

]

<img src="image/ml_robot.jpg" height=380px> 
from <a href="https://medium.com/@dkwok94/machine-learning-for-my-grandma-ca242e97ef62">medium.com</a>

]

---

# Herkunft von ML

---

# Leicht zu verwechseln

<ul>
 <li class="m1">AI</li>
 <ul class="level">
 <li><high>Intelligenz realisiert durch Maschinen</high> im Vergleich zu Intelligenz realisiert durch Menschen oder Tiere.</li>
 </ul>
 <li class="m2">Statistik</li>
 <ul class="level">
 <li><high>Feld der Mathematik</high>, das sich mit der Erhebung, Verarbeitung, Analyse, und Interpretation von Daten beschäftigt.</li>
 </ul>
 <li class="m3">Big Data</li>
 <ul class="level">
 <li>Beschäftigt sich mit Daten, die <high> zu gross und/oder zu komplex</high> für traditionelle Tools der Datenverarbeitung sind.</li>
 </ul>
 <li class="m4">Data Science</li>
 <ul class="level">
 <li>Multi-disziplinares Feld, das sich mit Methoden und Systemen zur Extraktion von <high>Erkenntnissen aus Daten</high> beschäftigt</li>
 </ul>
</ul>

]

]

---

<h1><a href="">Warum ML?</a></h1>

---

# Zwei Szenarien

<ul>
 <li class="m1">Herzinfarkt vorhersagen</li>
 <ul class="level">
 <li>Ein Patient kommt in die Notaufnahme mit Schmerzen in der Brust und befürchtet einen Herzinfarkt.</li> 
 <li>Wie entscheidet ihr, ob der Patient einen Herzinfarkt hat oder nicht?</li>
 </ul>
 
 <li class="m2">Verkaufszahlen vorhersagen</li>
 <ul class="level">
 <li>Die Unternehmensführung überlegt eine neue Filiale in Basel zu eröffnen.</li> 
 <li>Wie entscheidet ihr, ob prospektive Verkaufszahlen eine neue Filiale rechtfertigen?</li>
 </ul>
</ul>

]

<img src="image/chestpain.jpg" height=180px width=260px> 
from <a href="https://medium.com/@dkwok94/machine-learning-for-my-grandma-ca242e97ef62">medium.com</a>

<img src="image/storefront.jpg" height=180px width=260px> 
from <a href="https://thirdmanrecords.com/locations/detroit-storefront">thirdmanrecords.com</a>

]

---

---

# Können wir unser Intuition trauen?

<ul>
 <li class="m1">Intuition...</li>
 
 <ul class="level">
 <li></li> 
 <li></li> 
 <li></li> 
 <li></li> 
 <li></li>
 </ul>
</ul>

]

<img src="image/intuition1.png" height=180px> 
adapted from <a href="https://medium.com/@dkwok94/machine-learning-for-my-grandma-ca242e97ef62">medium.com</a>

<img src="image/intuition2.png" height=180px> 
adapted from <a href="https://thirdmanrecords.com/locations/detroit-storefront">thirdmanrecords.com</a>

]

---

# Können wir unser Intuition trauen?

<ul>
 <li class="m1">Intuition...</li>
 
 <ul class="level">
 <li>...verrät wenig darüber <high>wie die Vorhersage zustande gekommen ist</high>.</li> 
 <li>...kann leicht durch <high>andere Beweggründe als Akkuratheit</high> beeinflusst worden sein.</li> 
 <li>...es kann nicht festgestellt werden, ob <high>alle relevanten Informationen</high> berücksichtigt wurde.</li> 
 <li>...ist schwierig (exakt) zu <high>reproduzieren</high>.</li> 
 <li>...ist im Nachhinein <high>leicht zu verteidigen</high>.</li>
 </ul>
</ul>

]

]

---

---

# Vorteile des maschinellen Lernens

]

<img src="image/ml1.png" height=180px> 
from <a href="https://medium.com/@dkwok94/machine-learning-for-my-grandma-ca242e97ef62">medium.com</a>

<img src="image/ml2.png" height=180px> 
from <a href="https://thirdmanrecords.com/locations/detroit-storefront">thirdmanrecords.com</a>

]

---

# Vorteile des maschinellen Lernens

<ul>
 <li class="m1">ML...</li>
 
 <ul class="level">
 <li>...kann <high>alle Daten</high> berücksichtigen.</li> 
 <li>...ist <high>explizit, reproduzierbar, und quantitativ</high>,</li> 
 <li>...kann die <high>wichtigen Variablen identifizieren</high>.</li> 
 <li>...kann <high>Wahrscheinlichkeiten</high> und erwartete Fehler ausgeben. </li> 
 <li>...kann <high>neue Erkenntnisse</high> über die Daten liefern.</li>
 <li>...kann <high>automatisiert</high> werden.</li>
 </ul>
</ul>

]

]

---

<h1><a href="">Bereiche des ML</a></h1>

---

# Bereiche des maschinellen Lernens

<ul>
 <li class="m1">Es gibt verschiedene Bereiche des maschinellen Lernens mit jeweils eigenen Algorithmen.</li>
 <li class="m2">Wir fokussieren auf den Bereich des <high>Supervised Learning</high> (Deutsch: überwachtes Lernen).</li>
</ul>

]

<img src="image/mltypes.png" height=500px> 
from <a href="image/mltypes.png">amazonaws.com</a>

]

---

# Terminologie

<tr>
 <td bgcolor="white">
 Term
 </td>
 <td bgcolor="white">
 Definition
 </td> 
 <td bgcolor="white">
 Beispiel
 </td> 
</tr>
<tr>
 <td bgcolor="white">
 Case (Fall)
 </td>
 <td bgcolor="white">
 Die <high>Beobachtungseinheit</high> der Daten.
 </td> 
 <td bgcolor="white">
 Ein Patient, eine Filiale, etc.
 </td> 
</tr>
<tr>
 <td bgcolor="white">
 Feature (Variable, Prädiktor)
 </td>
 <td bgcolor="white">
 Eine gemessene <high>Eigenschaft</high> der Cases. 
 </td> 
 <td bgcolor="white">
 Alter, Temperatur, Land, etc.
 </td> 
</tr>
<tr>
 <td bgcolor="white">
 Criterion (Variable, Kriterium)
 </td>
 <td bgcolor="white">
 Das <high>Feature</high>, das man <high>vorhersagen</high> will.
 </td> 
 <td bgcolor="white">
 Herzinfarkt, Verkäufe, etc.
 </td> 
</tr>
<tr>
 <td bgcolor="white">
 Daten
 </td>
 <td bgcolor="white">
 Üblicherweise <high>rechteckig</high> mit <high>Cases in Zeilen</high> und <high>Features in Spalten</high>.
 </td> 
 <td bgcolor="white">
 <mono>.csv</mono>, <mono>.xls</mono>, <mono>.sav</mono>, etc.
 </td> 
</tr>
</table>

]

]

---

# Supervised learning

<ul>
 <li class="m1">Traditionell der <high>dominante Bereich</high> des machine learnings.</li>
 <li class="m2">Supervised learning benötigt <high>gelabelte Daten</high> um ein <high>Modell</high> zu lernen, das das Kriterium in Beziehung zu den Features setzt.</li>
</ul>

Beispiel in Worten

Wenn <mono>cp</mono> (chest pain) nicht <mono>a</mono> (asymptomatic) ist und <mono>age</mono> grösser ist als <mono>60</mono>, dann ist die Wahrscheinlichkeit für einen Herzinfarkt gross, anderfalls niedrig.

]

<img src="image/supervised.png"> 

]

---

# Drei Modelle des Supervised Learnings

---

# Zwei Problemtypen des Supervised Learnings

<ul>
 <li class="m1">Regression</li>
 
 <ul class="level">
 <li>Vorhersage eines <high>numerischen, kontinuierlichen Kriteriums</high>.</li> 
 <li>Vorhersage des Cholesterinspiegels mit Alter</li>
 </ul> 
 <li class="m2">Klassifikation</li>
 
 <ul class="level">
 <li>Vorhersage eines <high>kategorialen, diskreten Kriteriums</high>.</li> 
 <li>Vorhersage, ob Herzinfarkt ja oder nein</li>
 </ul> 
</ul>

]

]

---

# Unsupervised learning

<ul>
 <li class="m1">Analysiert die Zusammenhänge zwischen Cases oder Features um <high>zugrunde liegende Strukturen zu identifizieren</high>.</li> 
 <ul class="level">
 <li><high>Dimensionsreduktion</high>: Zusammenfassung von Features auf Basis ihrer Zusammenhänge durch eine kleinere Anzahl synthetischer Features.</li> 
 <li><high>Clustering</high>: Gruppierung von Cases auf Basis ihrer Ähnlichkeiten zueinander.</li>
 </ul>
</ul>

]

]

---

# Reinforcement learning

<ul>
 <li class="m1">Bereich <high>zwischen Supervised und Unsupervised</high> Learning.</li> 
 <li class="m2"><high>Lernt iterativ</high> auf Basis von minimalem Feedback.</li> 
 <li class="m3">Prominenterweise involviert in:</li>
 <ul class="level"> 
 <li>Modell fitting.</li> 
 <li>Robotik.</li> 
 <li>Spiele wie Schach, Go, oder Mario Kart.</li>
 </ul>
</ul>

]

<img src="image/roboarm.gif" width=320px> 
from <a href="https://giphy.com/explore/reinforcement-learning">giphy.com</a>

<img src="image/mariokart.gif" width=320px> 
from <a href="https://blogs.nvidia.com/blog/2017/04/14/tensorkart-ai-mario-kart/">nvidia.com</a>

]

<!---

# Reinforcement learning

<ul>
 <li class="m1">Bereich <high>zwischen Supervised und Unsupervised</high> Learning.</li> 
 <li class="m2"><high>Lernt iterativ</high> auf Basis von minimalen Feedback.</li> 
 <li class="m3">Prominenterweise involviert in:</li>
 <ul class="level"> 
 <li>Modell fitting.</li> 
 <li>Robotik.</li> 
 <li>Spiele wie Schach, Go, oder Mario Kart.</li>
 </ul>
</ul>

]

]

--->

---

# Machine learning ist mehr als Algorithmen

<img src="image/mlsteps.png" height=440px> 
from <a href="https://www.houseofbots.com/images/news/11493/cover.png">houseofbots.com</a>

---
class: middle, center

<h1><a href=https://therbootcamp.github.io/ML_2020Apr/index.html>Agenda</a></h1>