
Apache Flume: Distributed Log Collection for Hadoop - Second Edition
Beschreibung
Alle Preise
Weitere Details
Weitere Ausgaben
Inhalt
- Intro
- Apache Flume: Distributed Log Collection for Hadoop Second Edition
- Table of Contents
- Apache Flume: Distributed Log Collection for Hadoop Second Edition
- Credits
- About the Author
- About the Reviewers
- www.PacktPub.com
- Support files, eBooks, discount offers, and more
- Why subscribe?
- Free access for Packt account holders
- Preface
- What this book covers
- What you need for this book
- Who this book is for
- Conventions
- Reader feedback
- Customer support
- Downloading the example code
- Errata
- Piracy
- Questions
- 1. Overview and Architecture
- Flume 0.9
- Flume 1.X (Flume-NG)
- The problem with HDFS and streaming data/logs
- Sources, channels, and sinks
- Flume events
- Interceptors, channel selectors, and sink processors
- Tiered data collection (multiple flows and/or agents)
- The Kite SDK
- Summary
- 2. A Quick Start Guide to Flume
- Downloading Flume
- Flume in Hadoop distributions
- An overview of the Flume configuration file
- Starting up with "Hello, World!
- Summary
- 3. Channels
- The memory channel
- The file channel
- Spillable Memory Channel
- Summary
- 4. Sinks and Sink Processors
- HDFS sink
- Path and filename
- File rotation
- Compression codecs
- Event Serializers
- Text output
- Text with headers
- Apache Avro
- User-provided Avro schema
- File type
- SequenceFile
- DataStream
- CompressedStream
- Timeouts and workers
- Sink groups
- Load balancing
- Failover
- MorphlineSolrSink
- Morphline configuration files
- Typical SolrSink configuration
- Sink configuration
- ElasticSearchSink
- LogStash Serializer
- Dynamic Serializer
- Summary
- 5. Sources and Channel Selectors
- The problem with using tail
- The Exec source
- Spooling Directory Source
- Syslog sources
- The syslog UDP source
- The syslog TCP source
- The multiport syslog TCP source
- JMS source
- Channel selectors
- Replicating
- Multiplexing
- Summary
- 6. Interceptors, ETL, and Routing
- Interceptors
- Timestamp
- Host
- Static
- Regular expression filtering
- Regular expression extractor
- Morphline interceptor
- Custom interceptors
- The plugins directory
- Tiering flows
- The Avro source/sink
- Compressing Avro
- SSL Avro flows
- The Thrift source/sink
- Using command-line Avro
- The Log4J appender
- The Log4J load-balancing appender
- The embedded agent
- Configuration and startup
- Sending data
- Shutdown
- Routing
- Summary
- 7. Putting It All Together
- Web logs to searchable UI
- Setting up the web server
- Configuring log rotation to the spool directory
- Setting up the target - Elasticsearch
- Setting up Flume on collector/relay
- Setting up Flume on the client
- Creating more search fields with an interceptor
- Setting up a better user interface - Kibana
- Archiving to HDFS
- Summary
- 8. Monitoring Flume
- Monitoring the agent process
- Monit
- Nagios
- Monitoring performance metrics
- Ganglia
- Internal HTTP server
- Custom monitoring hooks
- Summary
- 9. There Is No Spoon - the Realities of Real-time Distributed Data Collection
- Transport time versus log time
- Time zones are evil
- Capacity planning
- Considerations for multiple data centers
- Compliance and data expiry
- Summary
- Index
Systemvoraussetzungen
Dateiformat: ePUB
Kopierschutz: Adobe-DRM (Digital Rights Management)
Systemvoraussetzungen:
- Computer (Windows; MacOS X; Linux): Installieren Sie bereits vor dem Download die kostenlose Software Adobe Digital Editions (siehe E-Book Hilfe).
- Tablet/Smartphone (Android; iOS): Installieren Sie bereits vor dem Download die kostenlose App Adobe Digital Editions oder die App PocketBook (siehe E-Book Hilfe).
- E-Book-Reader: Bookeen, Kobo, Pocketbook, Sony, Tolino u.v.a.m. (nicht Kindle)
Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet – also für „fließenden” Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an.
Mit Adobe-DRM wird hier ein „harter” Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.
Bitte beachten Sie: Wir empfehlen Ihnen unbedingt nach Installation der Lese-Software diese mit Ihrer persönlichen Adobe-ID zu autorisieren!
Weitere Informationen finden Sie in unserer E-Book Hilfe.
Dateiformat: PDF
Kopierschutz: Adobe-DRM (Digital Rights Management)
Systemvoraussetzungen:
- Computer (Windows; MacOS X; Linux): Installieren Sie bereits vor dem Download die kostenlose Software Adobe Digital Editions (siehe E-Book Hilfe).
- Tablet/Smartphone (Android; iOS): Installieren Sie bereits vor dem Download die kostenlose App Adobe Digital Editions oder die App PocketBook (siehe E-Book Hilfe).
- E-Book-Reader: Bookeen, Kobo, Pocketbook, Sony, Tolino u.v.a.m. (nicht Kindle)
Das Dateiformat PDF zeigt auf jeder Hardware eine Buchseite stets identisch an. Daher ist eine PDF auch für ein komplexes Layout geeignet, wie es bei Lehr- und Fachbüchern verwendet wird (Bilder, Tabellen, Spalten, Fußnoten). Bei kleinen Displays von E-Readern oder Smartphones sind PDF leider eher nervig, weil zu viel Scrollen notwendig ist.
Mit Adobe-DRM wird hier ein „harter” Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.
Bitte beachten Sie: Wir empfehlen Ihnen unbedingt nach Installation der Lese-Software diese mit Ihrer persönlichen Adobe-ID zu autorisieren!
Weitere Informationen finden Sie in unserer E-Book Hilfe.