JSDoc: Class: CountVectorizer

Specifies the minimum number of different documents a term must appear in to be included in the vocabulary. If this is an integer >= 1, this specifies the number of documents the term must appear in; if this is a double in [0,1), then this specifies the fraction of documents.

Source:

eclairjs/ml/feature/CountVectorizer.js, line 177

Returns:

Type: module:eclairjs/ml/param.DoubleParam

setBinary(value) → {module:eclairjs/ml/feature.CountVectorizer}

Parameters:

Name	Type	Description
`value`	boolean

Source:

eclairjs/ml/feature/CountVectorizer.js, line 137

Returns:

Type: module:eclairjs/ml/feature.CountVectorizer

setInputCol(value) → {module:eclairjs/ml/feature.CountVectorizer}

Parameters:

Name	Type	Description
`value`	string

Source:

eclairjs/ml/feature/CountVectorizer.js, line 66

Returns:

Type: module:eclairjs/ml/feature.CountVectorizer

setMinDF(value) → {module:eclairjs/ml/feature.CountVectorizer}

Parameters:

Name	Type	Description
`value`	float

Source:

eclairjs/ml/feature/CountVectorizer.js, line 96

Returns:

Type: module:eclairjs/ml/feature.CountVectorizer

setMinTF(value) → {module:eclairjs/ml/feature.CountVectorizer}

Parameters:

Name	Type	Description
`value`	float

Source:

eclairjs/ml/feature/CountVectorizer.js, line 106

Returns:

Type: module:eclairjs/ml/feature.CountVectorizer

setOutputCol(value) → {module:eclairjs/ml/feature.CountVectorizer}

Parameters:

Name	Type	Description
`value`	string

Source:

eclairjs/ml/feature/CountVectorizer.js, line 76

Returns:

Type: module:eclairjs/ml/feature.CountVectorizer

setVocabSize(value) → {module:eclairjs/ml/feature.CountVectorizer}

Parameters:

Name	Type	Description
`value`	integer

Source:

eclairjs/ml/feature/CountVectorizer.js, line 86

Returns:

Type: module:eclairjs/ml/feature.CountVectorizer

transformSchema(schema) → {module:eclairjs/sql/types.StructType}

Parameters:

Name	Type	Description
`schema`	module:eclairjs/sql/types.StructType

Source:

eclairjs/ml/feature/CountVectorizer.js, line 127

Returns:

Type: module:eclairjs/sql/types.StructType

uid() → {string}

An immutable unique ID for the object and its derivatives.

Source:

eclairjs/ml/feature/CountVectorizer.js, line 57

Returns:

Type: string

validateAndTransformSchema(schema) → {module:eclairjs/sql/types.StructType}

Validates and transforms the input schema.

Parameters:

Name	Type	Description
`schema`	module:eclairjs/sql/types.StructType

Source:

eclairjs/ml/feature/CountVectorizer.js, line 195

Returns:

Type: module:eclairjs/sql/types.StructType

vocabSize() → {module:eclairjs/ml/param.IntParam}

Max size of the vocabulary. CountVectorizer will build a vocabulary that only considers the top vocabSize terms ordered by term frequency across the corpus. Default: 2^18^

Source:

eclairjs/ml/feature/CountVectorizer.js, line 158

Returns:

Type: module:eclairjs/ml/param.IntParam