HadoopFileLinesReader¶

HadoopFileLinesReader is a Scala Iterator of Apache Hadoop's org.apache.hadoop.io.Text.

HadoopFileLinesReader is <> to access datasets in the following data sources:

HadoopFileLinesReader uses the internal <> that handles accessing files using Hadoop's FileSystem API.

Creating Instance¶

HadoopFileLinesReader takes the following when created:

=== [[iterator]] iterator Internal Property

iterator creates Hadoop's TaskAttemptID, TaskAttemptContextImpl and LineRecordReader.

iterator initializes LineRecordReader and passes it on to a RecordReaderIterator.

NOTE: iterator is used for Iterator-specific methods, i.e. hasNext, next and close.