JSDoc: Class: CountVectorizerModel

Specifies the minimum number of different documents a term must appear in to be included in the vocabulary. If this is an integer >= 1, this specifies the number of documents the term must appear in; if this is a double in [0,1), then this specifies the fraction of documents.

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 171

Returns:

Type: module:eclairjs/ml/param.DoubleParam

setInputCol(value) → {module:eclairjs/ml/feature.CountVectorizerModel}

Parameters:

Name	Type	Description
`value`	string

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 74

Returns:

Type: module:eclairjs/ml/feature.CountVectorizerModel

setMinTF(value) → {module:eclairjs/ml/feature.CountVectorizerModel}

Parameters:

Name	Type	Description
`value`	float

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 94

Returns:

Type: module:eclairjs/ml/feature.CountVectorizerModel

setOutputCol(value) → {module:eclairjs/ml/feature.CountVectorizerModel}

Parameters:

Name	Type	Description
`value`	string

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 84

Returns:

Type: module:eclairjs/ml/feature.CountVectorizerModel

transform(dataset) → {module:eclairjs/sql.DataFrame}

Parameters:

Name	Type	Description
`dataset`	module:eclairjs/sql.DataFrame

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 104

Returns:

Type: module:eclairjs/sql.DataFrame

transformSchema(schema) → {module:eclairjs/sql/types.StructType}

Parameters:

Name	Type	Description
`schema`	module:eclairjs/sql/types.StructType

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 115

Returns:

Type: module:eclairjs/sql/types.StructType

uid() → {string}

An immutable unique ID for the object and its derivatives.

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 59

Returns:

Type: string

validateAndTransformSchema(schema) → {module:eclairjs/sql/types.StructType}

Validates and transforms the input schema.

Parameters:

Name	Type	Description
`schema`	module:eclairjs/sql/types.StructType

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 189

Returns:

Type: module:eclairjs/sql/types.StructType

vocabSize() → {module:eclairjs/ml/param.IntParam}

Max size of the vocabulary. CountVectorizer will build a vocabulary that only considers the top vocabSize terms ordered by term frequency across the corpus. Default: 2^18^

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 152

Returns:

Type: module:eclairjs/ml/param.IntParam

vocabulary() → {Array.<string>}

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 66

Returns:

Type: Array.<string>

write() → {module:eclairjs/ml/util.MLWriter}

Source:

eclairjs/ml/feature/CountVectorizerModel.js, line 136

Returns:

Type: module:eclairjs/ml/util.MLWriter