JSDoc: Class: GroupedData

Class: GroupedData

eclairjs/sql. GroupedData

new GroupedData()

Source:

eclairjs/sql/GroupedData.js, line 31

Methods

agg() → {module:eclairjs/sql.DataFrame}

Compute aggregates by specifying a series of aggregate columns. Note that this function by default retains the grouping columns in its output. To not retain grouping columns, set spark.sql.retainGroupColumns to false. The available aggregate methods are defined in functions.

Parameters:

Name	Type	Description
`columnExpr,...columnExpr`	module:eclairjs/sql.Column \| string	or columnName, ...columnName

Since:

EclairJS 0.1 Spark 1.3.0

Source:

eclairjs/sql/GroupedData.js, line 54

Returns:

Type: module:eclairjs/sql.DataFrame

Example

// Java:
df.groupBy("department").agg(max("age"), sum("expense"));

avg(cols) → {module:eclairjs/sql.DataFrame}

Compute the avg value for each numeric columns for each group.

Parameters:

Name	Type	Description
`cols`	Array.<string>

Source:

eclairjs/sql/GroupedData.js, line 78

Returns:

Type: module:eclairjs/sql.DataFrame

count() → {module:eclairjs/sql.DataFrame}

Count the number of rows for each group.

Source:

eclairjs/sql/GroupedData.js, line 89

Returns:

Type: module:eclairjs/sql.DataFrame

max(cols) → {module:eclairjs/sql.DataFrame}

Compute the max value for each numeric columns for each group.

Parameters:

Name	Type	Description
`cols`	Array.<string>

Source:

eclairjs/sql/GroupedData.js, line 102

Returns:

Type: module:eclairjs/sql.DataFrame

mean(cols) → {module:eclairjs/sql.DataFrame}

Compute the mean value for each numeric columns for each group.

Parameters:

Name	Type	Description
`cols`	Array.<string>

Source:

eclairjs/sql/GroupedData.js, line 110

Returns:

Type: module:eclairjs/sql.DataFrame

min(cols) → {module:eclairjs/sql.DataFrame}

Compute the min value for each numeric columns for each group.

Parameters:

Name	Type	Description
`cols`	Array.<string>

Source:

eclairjs/sql/GroupedData.js, line 118

Returns:

Type: module:eclairjs/sql.DataFrame

pivot(pivotColumn, valuesopt) → {module:eclairjs/sql.GroupedData}

Pivots a column of the current DataFrame and perform the specified aggregation. There are two versions of pivot function: one that requires the caller to specify the list of distinct values to pivot on, and one that does not. The latter is more concise but less efficient, because Spark needs to first compute the list of distinct values internally.

Parameters:

Name	Type	Attributes	Description
`pivotColumn`	string		Name of the column to pivot.
`values`	module:eclairjs.List	<optional>	List of values that will be translated to columns in the output DataFrame.

Since:

EclairJS 0.1 Spark 1.6.0

Source:

eclairjs/sql/GroupedData.js, line 150

Returns:

Type: module:eclairjs/sql.GroupedData

Example

// Compute the sum of earnings for each year by course with each course as a separate column
  df.groupBy("year").pivot("course", new List(["dotNET", "Java"])).sum("earnings")

  // Or without specifying column values (less efficient)
  df.groupBy("year").pivot("course").sum("earnings")

sum(cols) → {module:eclairjs/sql.DataFrame}

Compute the sum value for each numeric columns for each group.

Parameters:

Name	Type	Description
`cols`	Array.<string>

Source:

eclairjs/sql/GroupedData.js, line 126

Returns:

Type: module:eclairjs/sql.DataFrame