2 - Codierung

Informationsdarstellung im Rechner, Spezialisierte Codes

2.0 – Codierung

Zahlensysteme, Ganze Zahlen

Lesson Learned

In diesem Kapitel geht es darum folgende Dinge zu verstehen und zu können

Information
- Definition
- Zusammenhang zur Informatik
Zahlensysteme
- Dezimal-, Binär, Hexadezimalsystem
- Umrechnungen zwischen diesen Zahlensystemen

Daten

Unter Daten versteht man im Allgemeinen Angaben, (Zahlen-)Werte oder formulierbare Befunde, die durch Messung, Beobachtung u. a. gewonnen wurden. [1] […] Für die Datenverarbeitung und (Wirtschafts-)Informatik werden Daten als Zeichen (oder Symbole) definiert, die Informationen darstellen und die dem Zweck der Verarbeitung dienen. [2] Wikipedia, 2018

[1] Daten. In: Duden (online)
[2] Heinz-Peter Gumm, Manfred Sommer: Einführung in die Informatik. 10. Auflage. Oldenbourg Verlag, ISBN 978-3-486-70641-3, S. 4 f.

Daten vs Information

Daten haben keinen Kontext
Durch Kombination verschiedener Daten lässt sich Kontext schaffen

Beispiel:

Datum1: Klausuraufgabe Mathe 3 Klasse
Datum2: 17+4
Datum3: = 15

Informationen können falsch sein, Daten nicht!

Zahlen - Ein Beispiel

Quelle: https://www.youtube.com/watch?v=33pH6ELDEeI

Herr Ober, Zahlen, bitte!

Zahlenwolke

Zahlensysteme

comic Quelle: https://xkcd.com/953/

Zahlensysteme

Hellomas

Grundlegende Grundlagen

Formel

Ein Beispiel $73_{10}$

Es soll die Zahl $73_{10}$ näher betrachtet werden.

Formel

Informelle Zerlegung der Zahl

7 Zehner, 3 Einer

Ein wenig formeller:

$ n_B={\color{#00b1ac}B}^0 \cdot {\color{#0070C0}{d_0}}+{\color{#00b1ac}B}^1 \cdot {\color{#0070C0}{d_1}} $
$ {\color{#00b1ac}B} = 10 $
$ {\color{#0070C0}{d}} = {\color{#0070C0}{d_0}} = 3, {\color{#0070C0}{d_1}} = 7 $
$ 73 = {\color{#00b1ac} {10} }^0 \cdot {\color{#0070C0}{3}} + {\color{#00b1ac} {10} }^1 \cdot {\color{#0070C0}{7}} $
Damit ist $ {\color{red}{r}} = 1 $

Zahlensysteme

Zahlensystem	Basis	Wertebereich	Beispiel
dezimal	10	{0,1,2,…,8,9}	$73_{10}$
binär	2	{0,1}	$1001001_{2}$
hexadezimal	16	{0,…,9,A,…,F}	$49_{16}$

Zahlensysteme

There are 10 types of people in the world:
Those who understand binary and those who don‘t!

10-for-two Quelle: https://www.schoeller.de/media/2157/ten-for-two-slider.png

Binäres Gedankenlesen

Binary Sudoku

comic Quelle: https://xkcd.com/74/

Wer benutzt was?

UseCases

Binary vs. Hex

$16 = 2^{\color{red}4}$

The Return of the Bin

conversion

The 10 Towers – Variante 1

Aufsummieren der Potenzen: $73_{10} = ???_{2}$

The 10 Towers – Variante 2

Rückwärts Hornerschema: $73_{10} = ???_{2}$

Übungen

Binär	Dezimal	Hexadezimal
101010
	37
		AC

Übungen

Binär	Dezimal	Hexadezimal
101010	42	2A
100101	37	25
10101100	172	AC

2.1 – Informationen im Rechner

Negative Zahlen,
Gleitkommazahlen,
Zeichen

Lesson Learned

In diesem Kapitel geht es darum folgende Dinge zu verstehen und zu können

Zahlendarstellungen
- Darstellung ganzer Zahlen
- Darstellung von und Rechnen mit negativen ganzen Zahlen
- Darstellung von und Rechnen mit Gleitkommazahlen
Einfache Codes
- Darstellung von Ziffern und Zeichen im Rechner
- Gängige Standards

Warum denn so negativ?

Positive ganze Zahlen lassen sich in einem Computer sehr einfach im Binärsystem darstellen, aber …

Wie lassen sich negative ganze Zahlen in einem Computer darstellen?

Wie macht JAVA das?

$: java -jar negativeNumbers.jar
Where to start?
-4
Where to end?
4
1111 1111 1111 1111 1111 1111 1111 1100
1111 1111 1111 1111 1111 1111 1111 1101
1111 1111 1111 1111 1111 1111 1111 1110
1111 1111 1111 1111 1111 1111 1111 1111
0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0001
0000 0000 0000 0000 0000 0000 0000 0010
0000 0000 0000 0000 0000 0000 0000 0011
0000 0000 0000 0000 0000 0000 0000 0100

2-Komplement

2-compliment

2-Komplement

Das 2-Komplement kann wie folgt grafisch dargestellt werden 2-compliment

2-Komplement

Dezimal	Ergebnis im 2-Komplement
4-5
5-4
15-8

2-Komplement

Dezimal	Ergebnis im 2-Komplement
4-5	0100 + 1011 = 1111
5-4	0101 + 1100 = 0001
15-8	01111 + 11000 = 00111

Zwischenergebniss

Ganze Zahlen ✓
Negative Zahlen ✓
Kommazahlen ?

illustation

Kommazahlen - Übersicht

aufteilung

Kommazahlen - Festkommazahlen

aufteilung

Umwandlung in eine Festkommazahl

Die Umwandlung besteht aus 3 Schritten:

Umwandlung des ganzzahligen Anteils
Umwandlung der Nachkommastellen
Addition der beiden Ergebnisse

Beispiel

Umwandelung von 73,4

$73_{10} = 1001001_{2}$ (siehe vorheriges Kapitel)
Anwenden der Multiplikationsmethode:
1. $ 0,4 \cdot 2 = 0,8 \longrightarrow 0 (erstes Bit) $
2. $ 0,8 \cdot 2 = 1,6 \longrightarrow 1 $
3. $ 0,6 \cdot 2 = 1,2 \longrightarrow 1 $
4. $ 0,2 \cdot 2 = 0,4 \longrightarrow 0 $
5. $ 0,4 \cdot 2 = 0,8 \longrightarrow 0 $
6. Periode gefunden ⇒ Abbruch
Addition: $1001001,\overline{0110}$

Gleitkommazahlen (IEEE 754)

$$ x=s \cdot m \cdot 2^e $$ $$ s = (-1) ^{\color{#00b1ac}S} $$ $$ e = {\color{#0070C0}E}-b $$ $$ m = 1,{\color{red}{M}} $$

Einfache Genauigkeit (float)

float

Der Exponent kann Werte von -126 bis +127 annehmen
- Die Werte -127 und +128 sind für Spezialfälle reserviert
Der Biaswert b ist 127

Einfache Genauigkeit (double)

float

Der Exponent kann Werte von -1022 bis + 1023 annehmen
- Die Werte -1023 und + 1024 sind für Spezialfälle reserviert
Der Biaswert b ist 1023

Beispiel

Umwandlung der Dezimalzahl (hier 73,5) in eine binäre Festkommazahl ohne Vorzeichen $$ 73.5_{10} = 1001001.1_2 $$
Normalisieren und Bestimmen des Exponente

$$ 1001001.1_2 \cdot 2^{0} = 1.0010011_2 \cdot 2^{6} $$

$$ {\color{red}M} = 00100110000000000000000_{2} $$ $$ {\color{#0070C0}E} = 6 + 127 = 110_2 + 1111111_2 = 10000101_2 $$

Vorzeichen-Bit bestimmen $ {\color{#00b1ac}S}=0 $
Gleitkommazahl zusammensetzen (float) $$ {\color{#00b1ac}0}{\color{#0070C0}{1000010 1}}{\color{red}{0010011 00000000 00000000}} $$

Spezialfälle

Anmerkung

r ist die Anzahl der Exponenten-Bits

Exponent E	Mantisse M	Bedeutung
$ E = 0 $	$ M = 0 $	$ \pm 0 $
$ E = 0 $	$ M \ne 0 $	$ \pm 0.M \cdot 2 ^{1-b} $
$ 0 < E < 2^{r}-1 $	$ M \ne 0, M = 0 $	$ \pm 1.M \cdot 2 ^{E-b} $
$ E = 2^r -1 $	$ M = 0 $	$ \pm \infty $
$ E = 2^r -1 $	$ M \ne 0 $	$ NaN $

Beispiel – Addition

Es seien zwei Gleitkommazahlen a und b gegeben

a = |0|10000001|(1)10010000000000000000000
b = |0|01111111|(1)10110001000100000000000

Die Zahl b ist kleiner und muss daher umgerechnet werden

b = |0|10000001|(0)01101100010001000000000

Addition

a + b = |0|10000001|(1)11111100010001000000000

Bezug zur Programmiersprache

Datentyp	Größe	Wrapper-Klasse	Wertebereich	Beschreibung
`byte`	8 Bit	`java.lang.Byte`	−128 … +127	2-Komp.
`short`	16 Bit	`java.lang.Short`	−32.768 … +32.767	2-Komp.
`int`	32 Bit	`java.lang.Integer`	−2.147.483.648 … +2.147.483.647	2-Komp.
`long`	64 Bit	`java.lang.Long`	−9.223.372.036.854.775.808 … +9.223.372.036.854.775.807	2-Komp.
`float`	32 Bit	`java.lang.Float`	±1,4E−45 … ±3,4E+38	IEEE 754
`double`	64 Bit	`java.lang.Double`	±4,9E−324 … ±1,7E+308	IEEE 754

Übung

Festkommazahl	Gleitkommazahl
`01011001.010`
	`1 10000110 10110010010000000000000`

Übung

Festkommazahl	Gleitkommazahl
`01011001.010`	`0 10000101 01100101000000000000000`
`-11011001.001`	`1 10000110 10110010010000000000000`

AsciiTabelle

Ascii Tabelle

Mit den 7 Bits von ASCII kann man nur sehr wenige Zeichen darstellen.
Was ist z.B. mit Umlauten?

Emoji Keyboard

Quelle: https://www.youtube.com/watch?v=3AtBE9BOvvk

Unicode

Unicode ist ein Zeichensatz mit 32 Bits, der als weltweiter Standard geplant ist

Aufbau des Codes
- 32-Bit Codierung mit fester Länge
- Maximal 4.294.967.296 Zeichen darstellbar
- Notation im Hexadezimalsystem U+(XX)XXXXXX
- Dabei geben die letzten 2 Byte eine Position in einer Plane (Ebene) an
- Die Angabe der Plane ist dabei optional (Standard = 00)

Basic Multilingual Plane

plane

Das erste Byte adressiert den Block innerhalb der Plane, das zweite Byte ein Zeichen innerhalb des Blocks

UTF - Unicode Transformation Format

Um die Unicode-Zeichen im Rechner zur Weiterverarbeitung darstellen zu können gibt es die UTF-Codierung

Es gibt mehrere UTF-Standards

UTF-32: je Zeichen 4 Bytes (32 Bit)
- feste Länge, einfache Codierung, hoher Speicherbedarf
UTF-16: je Zeichen 2 oder 4 Bytes (16 – 32 Bit)
- Variable Länge, hoher Speicherbedarf
UTF-8: je Zeichen 1 bis 4 Byte (8 – 32 Bit)
- Variable Länge, niedriger Speicherbedarf

UTF8

UTF-8 ist dazu geeignet, den Speicherplatz eines Zeichens den Anforderungen anzupassen

Handelt es sich bei einem Zeichen um ein ASCII-Zeichen wird ein Byte zur Codierung benötig
- (0 – 127) → 0xxx xxx
Handelt es sich um ein anderes Zeichen werden 2 bis 4 Bytes zur Codierung benötigt
- Das erste Byte beginnt mit einer Anzahl von Einsen, die der Anzahl von zu verwendenden Bytes entspricht, gefolgt von einer 0
- Jedes folgende Byte beginnt mit 10

UTF-8

Unicode-Bereich	UTF-8-Kodierung	Möglichkeiten	Platz für
`0000 0000` – `0000 007F`	`0xxx xxxx`	128	7 Bits
`0000 0080` – `0000 07FF`	`110x xxxx` `10xx xxxx`	2048	11 Bits
`0000 0800` – `0000 FFFF`	`1110 xxxx` `10xx xxxx` `10xx xxxx`	65.536	16 Bits
`0001 0000` – `0010 FFFF`	`1111 0xxx` `10xx xxxx` `10xx xxxx` `10xx xxxx`	2.097.152	21 Bits

Beispiel

Es soll der Unicode U+265E (♞) in UTF-8 dargestellt werden:

U+265E benötigt selbst 14 Bits, also müssen zur UTF-8 Codierung 3
Bytes verwendet werden
- Grundgerüst für 3 Byte UTF-8 Codierung:
- 1110 xxxx | 10xx xxxx | 10xx xxxx
Binäre Darstellung von U+265E:
- 0010 0110 0101 1110
Einsetzen in das Grundgerüst ergibt:
- 1110 0010 | 1001 1001 | 1001 1110

UTF8 - Übung

Zeichen / Dezimalwert	Unicode	UTF-8
A / 65
ä / 257
Ў / 1038

UTF8 - Übung

Zeichen / Dezimalwert	Unicode	UTF-8
A / 65	U+0041	41
ä / 257	U+0101	C4 81
Ў / 1038	U+040E	D0 8E

2.2 – Dateiformate

Persistierung und Austausch von Daten

Lesson Learned

In diesem Kapitel geht es darum folgende Dinge zu verstehen und zu können

Aufbau von gängigen Dateiformaten
- Binäre Dateiformate
- Textbasierte Dateiformate

Überblick

Grundsätzlich lassen sich Dateien in 4 Kategorien einteilen:

	Ausführbar	Daten
Binär	Programme	Speicherabbilder von Objekten
Textbasiert	Skripte	yaml,xml,csv …

Programme

Dateien die Maschienencode enthalten werden Programme genannt.

Entstehen durch compilieren von Quellcode
Beispiele:
- C/C++
- go
- RUST
- Fortran
Es wird kein weiteres Programm benötigt um den Code auszuführen

Kennzeichnung im Dateisystem

Die Kennzeichnung von Dateien ist OS abhängig

Linux, MacOS
- In Unixoiden- Betriebsystemen werden Sie durch das Ausführungsrecht markiert
Windows
- Programme müssen die Endung .exe haben

Skripte

Dateien die Quellcode für einen Interpreter enthalten

Programmanweisungen werden als Text (Zeichencodiert) abgespeichert
Beispiele:
- Bash
- Python
- Powershell
Der Interpreter wird benötigt der die Anweisungen Zeilenweise umsetzt

Kennzeichnung im Dateisystem

Linux, MacOS
- In Unixoiden- Betriebsystemen werden Sie durch das Ausführungsrecht markiert
- Interpreter steht in der Ersten Zeile hinter der Shebang !#
Windows
- Die Dateiendung muss dem Entsprechenden Interpreter zugeordnet werden
- z.B.: .cmd,.bat -> Eingabeauforderung, .py -> Python

Binäre Daten

Daten werden Byteweise in eine Datei geschrieben

Sind nur mit speziellen Programmen zu öffnen
Nicht Menschenlesbar (Ohne Hilfsprogramm)
Beispiele:
- Datenbanken
- Bilder (.bmp, jpeg, .png)
- Altes Office-Formate (.xls,.doc)
- generische .dat oder .bin Dateien
Sehr performant

csv

Stunde,Montag,Dienstag,Mittwoch,Donnerstag,Freitag
1,Mathematik,Deutsch,Englisch,Mathematik,Kunst
2,Sport,Französisch,Geschichte,Sport,Geschichte
3,Sport,"Religion (ev, kath)",Kunst,,Kunst

Quelle: https://de.wikipedia.org/wiki/CSV_(Dateiformat)

CSV

Vorteile
- Einfach zu lesen
- Gut geeignet für Datenaustausch
Nachteile
- keine Formatierungen

JSON

JSON = Java Script Object Notation

{
  "id": {
    "$oid": "5968dd23fc13ae04d9000001"
  },
  "product_name": "PowerBook 5 Ultra",
  "supplier": ["Von-Neumann Inc.","Moore Corp."],
  "quantity": 71,
  "unit_cost": "$1123.47"
}

JSON

Vorteile:
- Menschenlesbar
- Typisiert (String,int,bool)
- Parser für viele Programmiersprachen
- Explizierte Formatierung
Nachteile
- Zeichencodiert (Mögliche Encoding Probleme)

XML

XML = Extensible Markup Language

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <to>Tove</to>
  <from>Jani</from>
  <heading>Reminder</heading>
  <body>Don't forget me this weekend!</body>
</note>

Quelle: https://www.w3schools.com/xml/note.xml

XML

Vorteile:
- Menschenlesbar
- Typisiert (erweiterbar)
- Parser für viele Programmiersprachen
- Explizierte Formatierung
- Validierbar
Nachteile
- Viel Overhead
- Langsamer Parser

YAML

YAML - YAML Ain’t Markup Language

invoice: 34843
date   : 2001-01-23
bill-to: &id001
    given  : Chris
    family : Dumars
    address:
        city    : Royal Oak
        postal  : 48046
ship-to: *id001
product:
    - sku         : BL394D
      description : Basketball
    - sku         : BL4438H
      description : Super Hoop
total: 4443.52

Quelle: http://yaml.org/start.html

YAML

Vorteile:
- Menschenlesbar
- Typisiert
- Parser für viele Programmiersprachen
- JSON ist Sub-Standard
Nachteile
- Viel Overhead (Whitespaces)
- Implizierte Formatierung (Fehleranfällig)

2.3 – Spezialisierte Codes

Huffman-Code, Hamming-Code

Lesson Learned

In diesem Kapitel geht es darum folgende Dinge zu verstehen und zu können

Spezialisierte Codes
- Motivation für spezielle Codierungen
- Optimale Codes
- Robuste Codes

Was ist ein Code überhaupt?

code-cloud

Ein anschauliches Beispiel

Quelle: https://www.youtube.com/watch?v=tH5943KAqeA

Ein anschauliches Beispiel

Quelle: https://www.youtube.com/watch?v=1zd1xNidSpc

Was ist ein Code?

Matse ausbildung

=Matse ausbildung

Technische Randbedingungen

Es kann technische Randbedingungen geben, die die Verwendung spezieller Codes nötig machen

Möglichkeiten zur Optimierung
- z.B. Binärcode auf dem Computer
Ungenauigkeiten
- z.B. Daten auf einer CD / DVD / Blu-ray
Bestimmte Formate
- z.B. QR-Code zur Erkennung mit Smartphones

Randbedingungen – Die CD

Technische Realisierung einer CD

Eine CD hat eine reflektierende Oberfläche
- Pits = (eingebrannte) Vertiefungen
- Lands = Erhebungen

cd-Technik

Codierung
- Pits & Lands = 0
- Übergänge = 1

Randbedingungen – Die CD

Technische Randbedingungen

Pits und Lands dürfen nicht zu lange werden und auch nicht zu kurz sein, da die genaue Anzahl sonst nicht korrekt ausgelesen werden kann
- Es müssen mindestens 2 Nullen und höchsten 11 Nullen zwischen zwei Einsen folgen
- 8-Bit-Codes sind nicht verwendbar
- Stattdessen wird ein 14-Bit-Code benutzt (EFM)

Speicheroptimierung

Codes zur Speicheroptimierung komprimieren Daten

Ziele der Kompression
- Möglichst Kompakte Darstellung -Verlustfreie Codierung (nicht immer)
Motivation
- Codes mit fester Länge (z.B. ASCII) ineffizient

deko

Lösungsansatz
- Kurzer Code für häufig vorkommende Zeichen
- Langer Code für seltene Zeichen

Präfixfreiheit

Wenn Codes unterschiedliche Länge haben, müssen diese präfixfrei sein

Kein Codewort ist der Anfang eines anderen Codewortes
Beispiel für nicht-präfixfreie Codierung

präfixfrei

Präfixfreiheit

baum

A	B	C	D	E
00	11	01	100	101

Huffman-Code

Der Huffman-Code ist eine Variante eines präfixfreien Codes

Algorithmus:

Schreibe Symbole mit Wahrscheinlichkeiten als Wald
Fasse die beiden Bäume mit der geringsten Wahrscheinlichkeit und der geringsten Tiefe in einem neuen Baum zusammen

Die Wahrscheinlichkeit für den neuen Zweig ergibt sich durch Addition

Wiederhole bis nur noch ein Baum existiert

Eigenschaften:

Code möglicherweise für jeden Anwendungsfall anders
Basiert auf den Auftrittswahrscheinlichkeiten eines Zeichens
Die mittlere Codelänge wird minimiert

Huffman-Code

Huffmann-Beispiel

Übung

Codieren Sie das folgende Wort nach dem Huffmann-Code:
MISSISSIPPI

LsgBaum

Mittlere Codelänge

mittlere Codelaenge

Magic

Kartentrick

Robuste Codierung

Manche Übertragungsmedien sind fehleranfällig

Fehler müssen erkannt und im Optimalfall korrigiert werden können
Lösungsvarianten
- Mehrfache Übertragung der Daten
  - Sehr einfach zu realisieren
  - Es werden sehr viele Daten übertragen
Prüfsummenverfahren -Es werden zusätzliche Informationen übertragen, die von den zu übertragenden Daten abhängig sind

Paritäten

Hamming-Code

Hamming Übersicht

Hamming-Code

Beispiel für $ N=7=2^3 -1 $

3 Paritätsbits $ p_i $ an Stellen 1, 2, 4 (2er-Potenzen)
4 Datenbits $ d_n $ an Stellen 3, 5, 6, 7

Bitposition	1	2	3	4	5	6	7
Aufteilung	Parität	Parität	Daten	Parität	Daten	Daten	Daten
Daten	p0	p1	0	p2	1	1	0

Hamming-Code

Die Bitmaske …

… beginnt am entsprechenden Paritätsbit $ p_i $ und ergibt sich als Folge von $2^{i}$ Einsen, dann $2^{i}$ Nullen, dann wieder $2^{i}$ Einsen, usw.
… gibt die Bits an, die an der Berechnung des jeweiligen Paritätsbits beteiligt sind

Bitposition	1	2	3	4	5	6	7
Aufteilung	Parität	Parität	Daten	Parität	Daten	Daten	Daten
Daten	$p_0$	$p_1$	0	$p_2$	1	1	0
Bitmaske p0	1	0	1	0	1	0	1
Bitmaske p1	-	1	1	0	0	1	1
Bitmaske p2	-	-	-	1	1	1	1

Hamming-Code

Beispiel für N = 7

Die Paritätsbits werden mit einer XOR-Verknüpfung berechnet

Bitposition	1	2	3	4	5	6	7
Aufteilung	Parität	Parität	Daten	Parität	Daten	Daten	Daten
Daten	$p_0$	$p_1$	0	$p_2$	1	1	0
Bitmaske p0	1	0	1	0	1	0	1
Bitmaske p1	-	1	1	0	0	1	1
Bitmaske p2	-	-	-	1	1	1	1

$p_0$ = 0 ⊕ 1 ⊕ 0 = 1 $p_1$ = 0 ⊕ 1 ⊕ 0 = 1 $p_2$ = 1 ⊕ 1 ⊕ 0 = 0

Hamming-Code - Paritäten

Beispiel für N = 7

Die Paritätsbits werden mit einer XOR-Verknüpfung berechnet

Bitposition	1	2	3	4	5	6	7
Aufteilung	Parität	Parität	Daten	Parität	Daten	Daten	Daten
Daten	1	1	0	0	1	1	0
Bitmaske p0	1	0	1	0	1	0	1
Bitmaske p1	-	1	1	0	0	1	1
Bitmaske p2	-	-	-	1	1	1	1

$p_0$ = 0 ⊕ 1 ⊕ 0 = 1

$p_1$ = 0 ⊕ 1 ⊕ 0 = 1

$p_2$ = 1 ⊕ 1 ⊕ 0 = 0

Hamming-Code

Fehlerfall 1 - Kein Fehler

Bitposition	1	2	3	4	5	6	7
Aufteilung	Parität	Parität	Daten	Parität	Daten	Daten	Daten
Gesendet	1	1	0	0	1	1	0
Empfangen	1	1	0	0	1	1	0
Berechnet	1	1		0
Bitmasken p_i	1-0-0	0-1-0	1-1-0	0-0-1	1-0-1	0-1-1	1-1-1

Berechnung der Paritätsbits

$p_0$ = 0 ⊕ 1 ⊕ 0 = 1
$p_1$ = 0 ⊕ 1 ⊕ 0 = 1
$p_2$ = 1 ⊕ 1 ⊕ 0 = 0

Vergleiche:

gleich empfangenem Bit ✔
gleich empfangenem Bit ✔
gleich empfangenem Bit ✔

👍

Hamming-Code

Fehlerfall 2 - Datenfehler

Bitposition	1	2	3	4	5	6	7
Aufteilung	Parität	Parität	Daten	Parität	Daten	Daten	Daten
Gesendet	1	1	0	0	1	1	0
Empfangen	1	1	0	0	1	1	1
Berechnet	0	0		1
Bitmasken p_i	1-0-0	0-1-0	1-1-0	0-0-1	1-0-1	0-1-1	1-1-1

Berechnung der Paritätsbits

$p_0$ = 0 ⊕ 1 ⊕ 1 = 0
$p_1$ = 0 ⊕ 1 ⊕ 1 = 0
$p_2$ = 1 ⊕ 1 ⊕ 1 = 1

Vergleiche:

ungleich empfangenem Bit ✘
ungleich empfangenem Bit ✘
ungleich empfangenem Bit ✘

Folgerung:
Fehler in bit 7 !

Hamming-Code

Fehlerfall 2 - Paritätsfehler

Bitposition	1	2	3	4	5	6	7
Aufteilung	Parität	Parität	Daten	Parität	Daten	Daten	Daten
Gesendet	1	1	0	0	1	1	0
Empfangen	0	1	0	0	1	1	0
Berechnet	1	1		0
Bitmasken p_i	1-0-0	0-1-0	1-1-0	0-0-1	1-0-1	0-1-1	1-1-1

Berechnung der Paritätsbits

$p_0$ = 0 ⊕ 1 ⊕ 0 = 1
$p_1$ = 0 ⊕ 1 ⊕ 0 = 1
$p_2$ = 1 ⊕ 1 ⊕ 0 = 0

Vergleiche

ungleich empfangenem Bit ✘
gleich empfangenem Bit ✔
gleich empfangenem Bit ✔

Folgerung:
Fehler in bit 1 !

Rechnung	Ergebniss
73 - 2^6 = 9	1
2^5	0
2^4	0
9 - 2^3 = 1	1
2^2	0
2^1	0
1 - 2^0 = 0	1

Rechnung	Ergebniss
73:2 = 36 Rest	1
36:2 = 18 Rest	0
18:2 = 9 Rest	0
9:2 = 4 Rest	1
4:2 = 2 Rest	0
2:2 = 1 Rest	0
1:2 = 0 Rest	1

2 - Codierung

Informationsdarstellung im Rechner, Spezialisierte Codes

2.0 – Codierung

Zahlensysteme, Ganze Zahlen

Lesson Learned

Daten

Daten vs Information

Zahlen - Ein Beispiel

Herr Ober, Zahlen, bitte!

Zahlensysteme

Zahlensysteme

Grundlegende Grundlagen

Ein Beispiel $73_{10}$

Zahlensysteme

Zahlensysteme

Binäres Gedankenlesen

Binary Sudoku

Wer benutzt was?

Binary vs. Hex

The Return of the Bin

The 10 Towers – Variante 1

The 10 Towers – Variante 2

Übungen

Übungen

2.1 – Informationen im Rechner

Negative Zahlen, Gleitkommazahlen, Zeichen

Lesson Learned

Warum denn so negativ?

Wie macht JAVA das?

2-Komplement

2-Komplement

2-Komplement

2-Komplement

Zwischenergebniss

Kommazahlen - Übersicht

Kommazahlen - Festkommazahlen

Umwandlung in eine Festkommazahl

Beispiel

Umwandelung von 73,4

Gleitkommazahlen (IEEE 754)

Einfache Genauigkeit (float)

Einfache Genauigkeit (double)

Beispiel

Spezialfälle

Beispiel – Addition

Bezug zur Programmiersprache

Übung

Übung

AsciiTabelle

Mit den 7 Bits von ASCII kann man nur sehr wenige Zeichen darstellen. Was ist z.B. mit Umlauten?

Emoji Keyboard

Unicode

Basic Multilingual Plane

UTF - Unicode Transformation Format

UTF8

UTF-8

Beispiel

UTF8 - Übung

UTF8 - Übung

2.2 – Dateiformate

Persistierung und Austausch von Daten

Lesson Learned

Überblick

Grundsätzlich lassen sich Dateien in 4 Kategorien einteilen:

Programme

Kennzeichnung im Dateisystem

Skripte

Kennzeichnung im Dateisystem

Binäre Daten

csv

CSV

JSON

JSON

XML

XML

YAML

YAML

2.3 – Spezialisierte Codes

Huffman-Code, Hamming-Code

Lesson Learned

Negative Zahlen,
Gleitkommazahlen,
Zeichen

Mit den 7 Bits von ASCII kann man nur sehr wenige Zeichen darstellen.
Was ist z.B. mit Umlauten?