Archiv für den Monat: Februar 2014

Facebook schluckt WhatsApp – oder: Der Untergang des Abendlandes

Sehr spannend. Wenn ich meine Timeline bei Facebook oder Twitter durchgucke, hagelt es heute Kommentare zur Übernahme von WhatsApp durch Facebook. Schön fand ich, dass Facebook seine gierigen Krallen nun in noch ein anderen soziales Netzwerk geschlagen hat und dass das ja die freie Marktwirtschaft und die Entscheidungsmöglichkeiten aushebeln würde … Das sehe ich dann doch etwas anders. Zum einen wird die freie Marktwirtschaft wohl nicht dadurch ausgehebelt, dass ein kostenfrei zu nutzender Service einen anderen kostenfrei zu nutzenden Service aufkauft. Und an Alternativen mangelt es auch nicht. Auch wenn ich mich dem Messenger-Wahn in der Vergangenheit etwas verweigert habe, habe ich mir (schon fast als Trotzreaktion) Threema fürs Android gekauft.

Threema ist WhatsApp in sicher. Und Sicherheit war in der Vergangenheit nun wahrlich kein Markenzeichen von WhatsApp. Threema verschlüsselt von Haus aus jede Kommunikation zwischen zwei Geräten vom Sender bis zum Empfänger. Keine Möglichkeiten, durch Abhören des WLANs alle Nachrichten mitzulesen (das geht bei WhatsApp) und auch keine Policy „Auf unseren internen Servern sind die Nachrichten unverschlüsselt, weil da ja eh keiner ran kommt“ (so läuft das bei der DE-Mail). Das die Server in der Schweiz und nicht in den USA stehen, beruhigt mich auch etwas. Auf der anderen Seite gibt es derzeit noch keine Multigerät-Fähigkeit. Das bedeutet, dass man den Account vom Android nicht auf dem iPad nutzen kann. Aber an einer Lösung dieses Problems wird derzeit gearbeitet und in meinen Augen ist das jetzt nicht so ein Drama.

Gut. Und warum nutzen dann alle WhatsApp und nicht Threema? Weil Threema Geld kostet und Geiz bekanntlich geil ist. Und dieser Microbetrag, den alle WhatsApp-Junkies in der Vergangenheit gespart haben, ist jetzt der Grund, warum alle darüber lamentieren, was für ein Verbrechen hier von Facebook am freien Konsumentenwillen begangen wird.

Leute, eure Entscheidung ist immer noch völlig frei. Geht hin, pack 1,60 Euro auf den Tisch des Hauses (iOS-Version kostet 1,79 Euro), macht Werbung und dann wertet ihr auch sehen, dass sich eure Kontaktliste wieder füllt.

Ich selber werde dann mal sehen, ob diese Messenger-Geschichte für mich überhaupt interessant ist. In der Vergangenheit habe ich WhatsApp nicht gebraucht und auch mein SMS-Bedarf war eher im einstelligen Bereich. Wer mich zu seiner Kontaktliste hinzufügen möchte, kennt in der Regel meine E-Mail Adresse oder findet mich unter meiner mobilen Rufnummer. Wenn wir uns persönlich treffen, lasse ich euch auch gerne meine ID scannen.

Links zum Thema:

  • Threema
  • Nein, WhatsApp verlinke ich hier nicht 🙂

Update mm_forum 1.9.2 -> 1.9.5

Vor etwa einer Woche ist eine neue Version der TYPO3 Extension mm_forum erschienen. Hintergrund ist, dass die alte Version 1.9.2 eine Sicherheitslücke hatte.

Sicherheitsbulletin: TYPO3-EXT-SA-2014-001

WICHTIG: Das war noch nicht alles, nach der Version 1.9.3 die mit dem Bulletin einhergehend veröffentlicht wurde, wurde noch eine neue Version veröffentlicht, die weitere Sicherheitslücken behebt. Also ggf. solltet ihr eure System noch mal aktualisieren!

Wenn ihr eigene Templates für euer Forum gemacht habt (die hoffentlich in einem eigenen Verzeichnis ausgelagert sind), solltet ihr beachten, dass ihr zwei der HTML Dateien anpassen müsst, weil ihr sonst nicht mehr posten könnt.

  • forum/new_post.html
  • forum/new_topic.html

Beide Dateien bekommen den folgenden Eintrag am Ende der Datei direkt nach dem Reset-Knopf:

<input type=“hidden“ name=“tx_mmforum_pi1[token]“ value=“###TOKEN###“ />

Meines Erachtens nach ist das alles gewesen, was neben dem Update von eurer Seite aus passieren muss. Ansonsten  wurden in der neuen Version alle Mailing-Aufrufe auf t3lib_mail_Message umgestellt. Wer also irgendwo am Mailing rumgefummelt hat, sollte seine UX-Klassen mal prüfen und anpassen.

Sicherheit – Safety und Security

Ich vermute, dass in diesem Blog über kurz oder lang irgendwelche Themen zu dem Oberbegriff „Sicherheit“ auftauchen werden. Ich werde mich bemühen, dass eindeutig zu beschrieben und zu taggen, aber für den Fall, dass die Texte nicht wirklich eindeutig sind, hier ein paar Worte zum Geleit.

Die deutsche Sprache ist mit ihrem einheitlichen Begriff „Sicherheit“ etwas schwach und wenig genau, insbesondere in Hinblick auf die IT. Die Menschen auf der Insel kennen für das, was wir als Sicherheit vermischen, zwei Begriffe. Meine ehemaligen Englischlehrer würden mir sicher zustimmen, wenn ich behaupte, dass ich kein Fachmann der englischen Sprache bin, aber ich leite mir die Begriffe wie folgt her:

  • Safety – Dabei handelt es sich um die Sicherheit gegen Verlust. Also Schutz gegen Diebstahl, Datenverlust oder ähnliches. Auf die IT bezogen begegnet man dieser Gefahr am Besten mit einem Backup.
  • Security –  Hierbei handelt es sich um Sicherheit gehen Einbruch. Also Schutz gegen Einbruch in Haus oder Datenspeicher. Gegen diese Gefahren schützt sich der ITler mit Verschlüsselung und Passwörter (die nicht „Gott123“ heißen sollten).

Wobei mich Wikipedia gerade darüber aufgeklärt hat, dass auch die englischsprachigen Menschen gerne mal die Begriffe verwechseln und -mischen und Security eigentlich ein Unterbegriff von Safty ist.

Bücher scannen

Da das Thema möglicherweise demnächst mal wieder relevant wird, schreibe ich mir mal eine kleine Anleitung hier hin, damit ich meine Notizen nicht in irgendeinem Datenberg zusammen raten muss.

Ich habe vor ein paar Monaten einen größeren Stapel  Bücher für den internen Gebrauch gescannt. Alles out of print Werke, die schon lange nicht mehr zu bekommen sind, die aber einer kleinen Gruppe als Grundlagenwerke bereit gestellt werden mussten. Da das Ganze nicht nach schlechten Internet-Raubkopien (mit aufgebogenem Buchrücken auf dem Scan) sondern einen gewissen Anspruch erfüllen sollte, habe ich tatsächlich je eins der Bücher zum Drucker gebracht, den Rücken abschneiden lassen und sie auf der Arbeit nach Feierabend durch den Einzelblatteinzug des Multifunktionsdruckers gejagt. Effektiv irgendwas um 2000 Seiten und 5 GB Bilddaten.

Ich haben von Vornherein darauf verzichtet, dem Scanner zu sagen, dass er da einfach ein PDF von machen soll. Schließlich wollte ich es „richtig“ machen und die Seiten in ansprechender Qualität abspeichern und zudem durchsuchbare PDF Dokumente haben, damit in Zukunft einfacher nach Stichworten gesucht werden kann. Am Ende saß ich vor der Mammutaufgabe, die ganzen Seiten durch die Texterkennung zu schicken und als PDFs zusammen zu packen.

Auf der Hardwareseite hatte ich einen Rechner mit Ubuntu-Linux. Wer also diese Anleitung auf einem anderen System mit einem anderen Betriebssystem nachspielen möchte, wird also ggf. etwas improvisieren müssen.

Installiert habe ich mir dafür die folgenden Pakete:

  • tesseract -> Ursprünglich von HP entwickelt, derzeit die wahrscheinlich beste verfügbare Open Source OCR Software. Erzeugt HTML-ähnliche Dateien, in denen nicht nur der Text, sondern auch die Position des Textes auf der verarbeiteten Seite gespeichert ist.
  • optimize2bw -> Macht aus dem Graustufenscan eine S/W-Grafik. Das macht sich bei 200- und mehrseitigen Büchern deutlich in der Datenmenge bemerktbar.
  • hocr2pdf -> Packt die oben erzeugten HTML-Daten mit einer beliebigen Grafik zusammen (hier natürlich die S/W-Version der Seite) zu einer PDF-Datei.
  • pdftk -> Packt eine Menge PDF-Dateien zu einer einzelnen Datei zusammen.

Der Workflow sieht dann auf der Shell wie folgt aus:

  • tesseract ./01/BUCH-0001.tif ./01/BUCH-0001 -l deu hocr
    • -l deu => Worterkennung für deutsche Sprachen
    • hocr => hOCR Datei erzeugen (HTML Variante)
  • optimize2bw -i ./01/BUCH-0001.tif -o ./01/BUCH-0001_opt.tif
  • hocr2pdf -i ./01/BUCH-0001_opt.tif -o s001.pdf < ./01/BUCH-0001.html

Das muss entweder für alle Seiten einzeln gemacht werden oder man findet jemanden, der einem erklärt, wie man Bash-Skripte erstellt. Ich habe die erste Variante gewählt, wäre aber besser beraten gewesen, einen Teil der so verschwendeten Zeit zu nutzen, um mit die Skripte selber zu erarbeiten. Abschließend, wenn alle Dateien erzeugt wurden:

  • pdftk *.pdf output FINALES_BUCH.pdf

Als weiteren Optimierungsschritt (oder anstelle von optimize2bw) hatte ich überlegt, die Seiten mit dem Befehl

  • convert -geometry 24% ./01/BUCH-0001.tif ./01/BUCH-0001_72.tif

auf 72 dpi runterzurechnen. Aber da der erkannte Text nur als unsichtbarer Layer in die Datei eingefügt wird, ist der zu lesende Text immer noch der ursprüngliche Scan. Und es hat sich gezeigt, dass es dann einfach keinen Spaß macht, am Monitor zu lesen. Zu verschwommen. Aber ich könnte mir vorstellen, wenn man Bilderbücher scannen möchte, wäre das durchaus ein adäquater Ersatz für optimize2bw. convert ist dann ein Teil von image magick, das muss dan ggf. noch installiert werden.

TYPO3 ist kein Blog-System

Das wird hier der obligatorische „Warum-blogge-ich-eigentlich“-Post. Wen sowas nicht interessiert, kann bedenkenlos wegschalten.
Ich liebe TYPO3. Ich bin „Certified TYPO3 Integrator“, verdiene meine Brötchen mit TYPO3 und mag, dass man das so super erweitern kann. Vor ein paar Jahren habe ich schon mal angefangen, irgendwelche geistigen Ergüsse mit tt_news auf die Webseite zu packen. Aber TYPO3 macht keine Lust aufs bloggen. Kleine Schriftarten, unübersichtliches Backend, alles etwas angestaubt. Eben einfach nicht das, was man haben möchte, wenn es „Spaß“ machen soll 🙂
Seit etwa einem Jahr macht meine Frau mit fast täglich eine Bento-Box als Mittagessen. Um der breiten Welt diese Kunstwerke zu zeigen, habe ich angefangen,  darüber zu bloggen. Erst auf Facebook, dann mit einem eigenen WordPress-Blog. Und WordPress macht dann schon Lust auf mehr. Ich bin zwar weit weg von dem Punkt, wo ich sagen würde, dass ich ein erfahrener Blogger bin, aber alles in allem regt sich in mir in den letzten Wochen dann doch immer mal wieder der kleine Kreationist, der irgendwas zu irgendwelchen Themen schreiben möchte. Aber das Bento-Blog ist dafür nicht der richtige Rahmen (weil es nicht um Bentos geht) und mit TYPO3 … nein.
Also neues WordPress auf dem eigenen Server aufgesetzt (zehn Minuten Sache) und die alten Beiträge von der Webseite übernommen (das sind alle Beiträge, die vor dem heutigen Datum stehen). Herrlich, wieder eine ranzige Extension, von der ich mich im TYPO3 verabschieden kann. Und nun schauen wir mal, wie lange die Muse mich küsst. Meine jugendlichen Versuche, Tagebuch zu führen sind ja auch immer nach zwei Einträgen eingeschlafen 🙂

Links zum heutigen Post