blf_01's Introduction

Teragrep

This is a portal page for accessing different parts of Teragrep.

List of Teragrep Components

Component	Description
ajs_01	Teragrep user-interface
blf_01	Bloom filter library
blf_02	MariaDB bloom filter plugin
bos_01	Teragrep flavor repack of s3proxy
cfe_16	HTTP event capture to RFC5424
doc_01	Teragrep documentation
dpf_02	Batch collect
dpf_03	Tokenizer Aggregator
jla_01	Logback RELP appender library
jla_02	Example source for jla_01
jla_04	Java Util logging RELP handler
jla_05	Log4j RELP plugin
jla_06	Log4j2 RELP plugin
jlt_01	Java lookup tables
jpr_01	Java PCRE library
jsa_01	JavaScript Log4js appender
jue_01	Java UNIX Extensions
pth_03	Data Processing Language (DPL) parser
pth_06	Teragrep Datasource for Apache Spark
pth_07	Data Processing Language (DPL) Interpreter for Apache Zeppelin
pth_10	Data Processing Language (DPL) translator for Apache Spark
rad_01	Record Audit Data library
rlo_04	rsyslog regex perfect file input plugin
rlo_06	Syslog (RFC 5424) library for Java
rlo_08	Syslog (RFC 5424) formatter for JavaScript
rlp_01	Java RELP library
rlp_02	NodeJS RELP library
rlp_03	Java RELP server library
rlp_05	Go RELP library
zep_01	Teragrep back-end

blf_01's People

Contributors

Watchers

blf_01's Issues

Add readme.adoc

Description

Add readme.adoc with sections mentioned in repo-template readme.

Generate permutations from minor tokens

For better search parameters we should include permutations of minor tokens.

Example major token permutations: a.b.c - > [a.b., a.b, a.b, a., a, .b.c, .b.c, .b., .b, b.c, b., b, .c, c]

Limit max token size

ERROR [2023-10-16 18:19:46,962] ({Executor task launch worker for task 27030} Logging.scala[logError]:94) - Exception in task 197.0 in stage 319.0 (TID 27030)
java.lang.OutOfMemoryError: GC overhead limit exceeded
        at sun.nio.cs.UTF_8.newDecoder(UTF_8.java:68)
        at java.lang.StringCoding.decode(StringCoding.java:213)
        at java.lang.String.<init>(String.java:463)
        at java.lang.String.<init>(String.java:515)
        at com.teragrep.blf_01.Token.toString(Token.java:85)
        at com.teragrep.functions.dpf_03.TokenAggregator.$anonfun$finish$1(TokenAggregator.scala:82)
        at com.teragrep.functions.dpf_03.TokenAggregator$$Lambda$36/263211599.apply(Unknown Source)
        at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:234)
        at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:234)
        at scala.collection.mutable.HashMap$$anon$1$$anonfun$foreach$2.apply(HashMap.scala:134)
        at scala.collection.mutable.HashMap$$anon$1$$anonfun$foreach$2.apply(HashMap.scala:134)
        at scala.collection.mutable.HashTable$class.foreachEntry(HashTable.scala:236)
        at scala.collection.mutable.HashMap.foreachEntry(HashMap.scala:40)
        at scala.collection.mutable.HashMap$$anon$1.foreach(HashMap.scala:134)
        at scala.collection.TraversableLike$class.map(TraversableLike.scala:234)
        at scala.collection.AbstractSet.scala$collection$SetLike$$super$map(Set.scala:47)
        at scala.collection.SetLike$class.map(SetLike.scala:92)
        at scala.collection.AbstractSet.map(Set.scala:47)
        at com.teragrep.functions.dpf_03.TokenAggregator.finish(TokenAggregator.scala:82)
        at com.teragrep.functions.dpf_03.TokenAggregator.finish(TokenAggregator.scala:59)
        at org.apache.spark.sql.execution.aggregate.ComplexTypedAggregateExpression.eval(TypedAggregateExpression.scala:261)
        at org.apache.spark.sql.catalyst.expressions.aggregate.TypedImperativeAggregate.eval(interfaces.scala:545)
        at org.apache.spark.sql.execution.aggregate.AggregationIterator$$anonfun$generateResultProjection$1.apply(AggregationIterator.scala:231)
        at org.apache.spark.sql.execution.aggregate.AggregationIterator$$anonfun$generateResultProjection$1.apply(AggregationIterator.scala:223)
        at org.apache.spark.sql.execution.aggregate.ObjectAggregationIterator.next(ObjectAggregationIterator.scala:86)
        at org.apache.spark.sql.execution.aggregate.ObjectAggregationIterator.next(ObjectAggregationIterator.scala:33)
        at scala.collection.Iterator$$anon$11.next(Iterator.scala:410)
        at scala.collection.Iterator$$anon$11.next(Iterator.scala:410)
        at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)
        at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)
        at org.apache.spark.sql.execution.WholeStageCodegenExec$$anonfun$11$$anon$1.hasNext(WholeStageCodegenExec.scala:624)
        at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:409)