Zeppelin — Notebook สำหรับApache Sparks
สำหรับคนที่ติดใจเขียนโปรแกรมแบบ notebook ผ่าน jupyter ตอนนี้มีโปรเจคที่ค่อนข้างใหม่ชื่อ Apache Zeppelin เหมาะมากสำหรับสาย data ที่ใช้…

สำหรับคนที่ติดใจเขียนโปรแกรมแบบ notebook ผ่าน jupyter ตอนนี้มีโปรเจคที่ค่อนข้างใหม่ชื่อ Apache Zeppelin เหมาะมากสำหรับสาย data ที่ใช้ Apache Sparks
ข้อดีหลักๆ
- Integrate กับ Sparks และ SQL เนียนๆ visualization สวยๆ
- วาง widget ไว้แนวขวางได้ด้วย ไม่ต้องเป็นแนวนอนอย่างเดียว
- ปรับแต่ง UI ได้ด้วย Angular
วิธีลง
ลง Sparks ก่อน เวลาลงถ้าไม่ได้ใช้ java8 ตัว brew จะบ่นๆ
brew cask install homebrew/cask-versions/java8
brew install apache-spark
จากนั้นลง Zeppelin ได้เลย ไม่จำเป็นต้องลง scala
brew install apache-zeppelin
ใช้งาน
เรียกใช้ server แบบนี้
zeppelin-daemon.sh start
จากนั้นก็ไปที่ http://localhost:8080 ได้เลย ตัว script จะรันแบบ daemon ไม่จำเป็นต้องเปิด terminal ทิ้งไว้

เปิดตัวอย่าง Basic Features ขึ้นมาแล้วก็เลือก Run All paragraphs


เมื่อรันเสร็จแล้วสามารถไปดู Job ใน Sparks UI ได้ด้วย


Troubleshooting
ถ้าตอนที่รันเจอ error แบบนี้
error: scala.reflect.internal.MissingRequirementError: object scala in compiler mirror not found.
ให้ลบ Java Version อื่นๆ ออกจากเครื่อง เก็น Java8 ที่ลงผ่าน brew ไว้อย่างเดียว