From e7c473933fe0da469f60727a30091695ac301dc8 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 27 Nov 2020 16:44:55 +0000
Subject: [PATCH 001/131] feature: Self tuning dynamic queue loading - better
 back pressure

---
 CHANGELOG.adoc                                |   4 +-
 README.adoc                                   |   2 +-
 .../parallelconsumer/BackoffAnalyser.java     |  46 +++
 .../parallelconsumer/BrokerPollSystem.java    |   2 +-
 .../parallelconsumer/DynamicLoadFactor.java   |  76 +++++
 .../ExponentialMovingAverage.java             |  21 ++
 .../OffsetSimultaneousEncoder.java            |   4 +-
 .../ParallelConsumerOptions.java              |  34 +-
 .../ParallelEoSStreamProcessor.java           | 191 +++++++++--
 .../parallelconsumer/RateLimiter.java         |  34 ++
 .../parallelconsumer/WindowedEventRate.java   |  30 ++
 .../parallelconsumer/WorkContainer.java       |   2 +-
 .../parallelconsumer/WorkManager.java         | 303 ++++++++++++++----
 .../LargeVolumeInMemoryTests.java             |   8 +-
 .../integrationTests/LoadTest.java            |  17 +-
 .../VeryLargeMessageVolumeTest.java           |  52 ++-
 .../sanity/ProgressBarTest.java               |   5 +-
 .../confluent/csid/utils/KafkaTestUtils.java  |  27 +-
 .../csid/utils/ProgressBarUtils.java          |  25 ++
 .../parallelconsumer/BackPressureTests.java   |  84 +++++
 .../parallelconsumer/OffsetEncodingTests.java |  34 +-
 .../ParallelEoSStreamProcessorTest.java       |   5 +-
 .../parallelconsumer/WorkManagerTest.java     |  34 +-
 .../src/test/resources/logback-test.xml       |   6 +-
 .../examples/core/CoreApp.java                |  10 +-
 .../examples/streams/StreamsApp.java          |   4 +-
 .../examples/vertx/VertxApp.java              |   4 +-
 pom.xml                                       |   2 +-
 28 files changed, 835 insertions(+), 231 deletions(-)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BackoffAnalyser.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressBarUtils.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java

diff --git a/CHANGELOG.adoc b/CHANGELOG.adoc
index 2c16e0eed..dc097e3ab 100644
--- a/CHANGELOG.adoc
+++ b/CHANGELOG.adoc
@@ -2,7 +2,9 @@
 
 == next
 
-* Fixes
+* Features:
+** Queueing and pressure system now self tuning, performance over default old tuning values (`softMaxNumberMessagesBeyondBaseCommitOffset` and `maxMessagesToQueue`) has doubled.
+* Improvements
 ** https://github.com/confluentinc/parallel-consumer/issues/37[Support BitSet encoding lengths longer than Short.MAX_VALUE #37] - adds new serialisation formats that supports wider range of offsets - (32,767 vs  2,147,483,647) for both BitSet and run-length encoding
 
 == v0.2.0.3
diff --git a/README.adoc b/README.adoc
index 701471518..a97d672bc 100644
--- a/README.adoc
+++ b/README.adoc
@@ -381,7 +381,7 @@ Where `${project.version}` is the version to be used:
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(KEY) // <2>
                 .maxMessagesToQueue(1000) // <3>
-                .maxNumberMessagesBeyondBaseCommitOffset(1000) // <4>
+                .softMaxNumberMessagesBeyondBaseCommitOffset(1000) // <4>
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BackoffAnalyser.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BackoffAnalyser.java
new file mode 100644
index 000000000..28151e04c
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BackoffAnalyser.java
@@ -0,0 +1,46 @@
+package io.confluent.parallelconsumer;
+
+import lombok.Getter;
+import lombok.extern.slf4j.Slf4j;
+
+import java.util.ArrayList;
+import java.util.List;
+
+@Slf4j
+public class BackoffAnalyser {
+
+    @Getter
+    private int currentTotalMaxCountBeyondOffset = 10_000;
+
+    private int stepUp = 10_000;
+
+    private double backoffMultiplier = 0.5; // aggressive
+
+    private double failureApprachThreshold = 0.2; // 20%
+
+    private List<Integer> failureAt = new ArrayList<>();
+
+    public BackoffAnalyser(final int initialMax) {
+        this.currentTotalMaxCountBeyondOffset = initialMax;
+    }
+
+    void onSuccess() {
+        if (!failureAt.isEmpty()) {
+            int recentFail = failureAt.get(failureAt.size() - 1);
+            int limit = (int) (recentFail * (1 - failureApprachThreshold));
+            if (currentTotalMaxCountBeyondOffset + stepUp < limit) {
+                currentTotalMaxCountBeyondOffset += stepUp;
+            }
+        } else {
+            currentTotalMaxCountBeyondOffset += stepUp;
+        }
+        log.debug("Succeeded, stepping up by {} to {}", stepUp, currentTotalMaxCountBeyondOffset);
+    }
+
+    void onFailure() {
+        failureAt.add(currentTotalMaxCountBeyondOffset);
+        currentTotalMaxCountBeyondOffset = (int) (currentTotalMaxCountBeyondOffset * backoffMultiplier);
+        log.debug("Failed, backing off by {} to {}", backoffMultiplier, currentTotalMaxCountBeyondOffset);
+    }
+
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
index d3f6a223b..7e31440bf 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
@@ -105,7 +105,7 @@ private boolean controlLoop() {
                         wm.registerWork(polledRecords);
 
                         // notify control work has been registered
-                        pc.notifyNewWorkRegistered();
+//                        pc.notifyNewWorkRegistered();
                     }
                 }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
new file mode 100644
index 000000000..15b987883
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
@@ -0,0 +1,76 @@
+package io.confluent.parallelconsumer;
+
+import lombok.Getter;
+
+import java.time.Duration;
+
+public class DynamicLoadFactor {
+
+    /**
+     * Don't change this unless you know what you're doing.
+     * <p>
+     * The default value is already quite aggressive for very fast processing functions.
+     * <p>
+     * This controls the loading factor of the buffers used to feed the executor engine. A higher value means more
+     * memory usage, but more importantly, more offsets may be beyond the highest committable offset for processing
+     * (which if the serialised information can't fit, will be dropped and could cause much larger replays than
+     * necessary).
+     */
+    private static final int DEFAULT_INITIAL_LOADING_FACTOR = 2;
+
+    private final long start = System.currentTimeMillis();
+    private final Duration coolDown = Duration.ofSeconds(2);
+    private final Duration warmUp = Duration.ofSeconds(5); // CG usually takes 5 seconds to start running
+    private long lastStep = 0;
+    private final int step = 1;
+    @Getter
+    private final int max = 5;
+
+    @Getter
+    int current = DEFAULT_INITIAL_LOADING_FACTOR;
+
+    public boolean maybeStepUp() {
+        long now = System.currentTimeMillis();
+        if (couldStep()) {
+            return doStep(now, lastStep);
+        }
+        return false;
+    }
+
+    private synchronized boolean doStep(final long now, final long myLastStep) {
+        if (current < max) {
+            // compare and set
+            if (myLastStep == lastStep) {
+                current = current + step;
+                lastStep = now;
+                return true;
+            } else {
+                // already done
+                return false;
+            }
+        } else {
+            return false;
+        }
+    }
+
+    boolean couldStep() {
+        return isWarmUpPeriodOver() && isNoCoolDown();
+    }
+
+    private boolean isNoCoolDown() {
+        if (lastStep == 0) return true;
+        long now = System.currentTimeMillis();
+        long elapsed = now - lastStep;
+        return elapsed > coolDown.toMillis();
+    }
+
+    boolean isWarmUpPeriodOver() {
+        long now = System.currentTimeMillis();
+        long elapsed = now - start;
+        return elapsed > warmUp.toMillis();
+    }
+
+    public boolean isMaxReached() {
+        return current >= max;
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
new file mode 100644
index 000000000..ec186ed7b
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
@@ -0,0 +1,21 @@
+package io.confluent.parallelconsumer;
+
+public class ExponentialMovingAverage {
+
+    private double alpha;
+    private Double oldValue;
+
+    public ExponentialMovingAverage(double alpha) {
+        this.alpha = alpha;
+    }
+
+    public double average(double value) {
+        if (oldValue == null) {
+            oldValue = value;
+            return value;
+        }
+        double newValue = oldValue + alpha * (value - oldValue);
+        oldValue = newValue;
+        return newValue;
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java
index f8f933a15..cb0533740 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java
@@ -99,7 +99,7 @@ private void initEncoders() {
         try {
             encoders.add(new BitsetEncoder(length, this, v1));
         } catch (BitSetEncodingNotSupportedException a) {
-            log.warn("Cannot use {} encoder ({})", BitsetEncoder.class.getSimpleName(), a.getMessage());
+            log.debug("Cannot use {} encoder ({})", BitsetEncoder.class.getSimpleName(), a.getMessage());
         }
 
         try {
@@ -187,7 +187,7 @@ private void registerEncodings(final Set<? extends OffsetEncoder> encoders) {
             try {
                 encoder.register();
             } catch (EncodingNotSupportedException e) {
-                log.warn("Removing {} encoder, not supported ({})", encoder.getEncodingType().description(), e.getMessage());
+                log.debug("Removing {} encoder, not supported ({})", encoder.getEncodingType().description(), e.getMessage());
                 toRemove.add(encoder);
             }
         }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
index a7f2ebe09..b171d5c49 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
@@ -4,10 +4,12 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.StringUtils;
 import lombok.Builder;
 import lombok.Getter;
 import lombok.ToString;
 import org.apache.kafka.clients.consumer.Consumer;
+import org.apache.kafka.clients.consumer.ConsumerConfig;
 import org.apache.kafka.clients.producer.Producer;
 
 import java.util.Objects;
@@ -94,38 +96,6 @@ public enum CommitMode {
     @Builder.Default
     private final CommitMode commitMode = CommitMode.CONSUMER_ASYNCHRONOUS;
 
-    /**
-     * Total max number of messages to process beyond the base committed offsets.
-     * <p>
-     * This acts as a sort sort of upper limit on the number of messages we should allow our system to handle, when
-     * working with large quantities of messages that haven't been included in the normal Broker offset commit protocol.
-     * I.e. if there is a single message that is failing to process, without this limit we will continue on forever with
-     * our system, with the actual (normal) committed offset never moving, and relying totally on our {@link
-     * OffsetMapCodecManager} to encode the process status of our records and store in metadata next to the committed
-     * offset.
-     * <p>
-     * At the moment this is a sort of sanity check, and was chosen rather arbitriarly. However, one should consider
-     * that this is per client, and is a total across all assigned partitions.
-     * <p>
-     * It's important that this is small enough, that you're not at risk of the broker expiring log segments where the
-     * oldest offset resides.
-     */
-    @Builder.Default
-    private final int maxNumberMessagesBeyondBaseCommitOffset = 1000;
-
-    /**
-     * Max number of messages to queue up in our execution system and attempt to process concurrently.
-     * <p>
-     * In the core module, this will be constrained by the {@link #numberOfThreads} setting, as that is the max actual
-     * concurrency for processing the messages. To actually get this degree of concurrency, you would need to have a
-     * matching number of threads in the pool.
-     * <p>
-     * However with the VertX engine, this will control how many messages at a time are being submitted to the Vert.x
-     * engine to process. As Vert.x isn't constrained by a thread count, this will be the actual degree of concurrency.
-     */
-    @Builder.Default
-    private final int maxMessagesToQueue = 100;
-
     /**
      * Number of threads to use in the core's thread pool.
      */
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index e3eac5789..2063dfe62 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -29,9 +29,9 @@
 import static io.confluent.parallelconsumer.ParallelEoSStreamProcessor.State.*;
 import static io.confluent.csid.utils.BackportUtils.isEmpty;
 import static io.confluent.csid.utils.BackportUtils.toSeconds;
-import static io.confluent.csid.utils.Range.range;
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.UserFunctions.carefullyRun;
+import static java.time.Duration.ofMillis;
 import static java.time.Duration.ofSeconds;
 import static java.util.concurrent.TimeUnit.MILLISECONDS;
 import static java.util.concurrent.TimeUnit.SECONDS;
@@ -44,6 +44,8 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
 
     private final ParallelConsumerOptions options;
 
+//    private final BackoffAnalyser backoffer;
+
     /**
      * Injectable clock for testing
      */
@@ -52,7 +54,7 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
 
     @Setter
     @Getter
-    private Duration timeBetweenCommits = ofSeconds(1);
+    private Duration timeBetweenCommits = ofMillis(500);
 
     private Instant lastCommit = Instant.now();
 
@@ -63,7 +65,7 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
     /**
      * The pool which is used for running the users's supplied function
      */
-    private final ExecutorService workerPool;
+    private final ThreadPoolExecutor workerPool;
 
     private Optional<Future<Boolean>> controlThreadFuture = Optional.empty();
 
@@ -102,6 +104,8 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
      * Used to request a commit asap
      */
     private final AtomicBoolean commitCommand = new AtomicBoolean(false);
+    private final DynamicLoadFactor dynamicExtraLoadFactor = new DynamicLoadFactor();
+    private Exception failureReason;
 
     public boolean isClosedOrFailed() {
         boolean closed = state == State.closed;
@@ -112,6 +116,10 @@ public boolean isClosedOrFailed() {
         return closed || doneOrCancelled;
     }
 
+    public Exception getFailureCause() {
+        return this.failureReason;
+    }
+
     /**
      * The run state of the controller.
      *
@@ -159,12 +167,33 @@ public ParallelEoSStreamProcessor(ParallelConsumerOptions newOptions) {
         options = newOptions;
         options.validate();
 
+//        this.backoffer = new BackoffAnalyser();
+
         this.consumer = options.getConsumer();
 
         checkNotSubscribed(consumer);
         checkAutoCommitIsDisabled(consumer);
 
-        this.workerPool = Executors.newFixedThreadPool(newOptions.getNumberOfThreads());
+        LinkedBlockingQueue<Runnable> poolQueue = new LinkedBlockingQueue<>();
+        workerPool = new ThreadPoolExecutor(newOptions.getNumberOfThreads(), newOptions.getNumberOfThreads(),
+                0L, MILLISECONDS,
+                poolQueue)
+        ;
+//        {
+//            @Override
+//            protected void beforeExecute(final Thread t, final Runnable r) {
+//                super.beforeExecute(t, r);
+//                if (dynamicExtraLoadFactor.couldStep() && getQueue().isEmpty() && wm.isNotPartitionedOrDrained()) {
+//                    boolean increased = dynamicExtraLoadFactor.maybeIncrease();
+//                    if (increased) {
+//                        log.warn("No work to do! Increased dynamic load factor to {}", dynamicExtraLoadFactor.getCurrent());
+//                    }
+//                }
+////                if (getQueue().size() < 100 && wm.isNotPartitionedOrDrained()) {
+////                    log.warn("Less than 100 tasks left!");
+////                }
+//            }
+//        };
 
         this.wm = new WorkManager<>(newOptions, consumer);
 
@@ -228,6 +257,7 @@ public void subscribe(Pattern pattern, ConsumerRebalanceListener callback) {
      */
     @Override
     public void onPartitionsRevoked(Collection<TopicPartition> partitions) {
+        numberOfAssignedPartitions = numberOfAssignedPartitions - partitions.size();
         try {
             log.debug("Partitions revoked (onPartitionsRevoked), state: {}", state);
             commitOffsetsThatAreReady();
@@ -245,10 +275,15 @@ public void onPartitionsRevoked(Collection<TopicPartition> partitions) {
      */
     @Override
     public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
+        numberOfAssignedPartitions = numberOfAssignedPartitions + partitions.size();
         wm.onPartitionsAssigned(partitions);
         usersConsumerRebalanceListener.ifPresent(x -> x.onPartitionsAssigned(partitions));
+        log.info("Assigned {} partitions - that's {} bytes per partition for encoding offset overruns", numberOfAssignedPartitions, OffsetMapCodecManager.DefaultMaxMetadataSize / numberOfAssignedPartitions);
     }
 
+    @Getter
+    private int numberOfAssignedPartitions;
+
     /**
      * Delegate to {@link WorkManager}
      *
@@ -256,6 +291,7 @@ public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
      */
     @Override
     public void onPartitionsLost(Collection<TopicPartition> partitions) {
+        numberOfAssignedPartitions = numberOfAssignedPartitions - partitions.size();
         wm.onPartitionsLost(partitions);
         usersConsumerRebalanceListener.ifPresent(x -> x.onPartitionsLost(partitions));
     }
@@ -554,7 +590,8 @@ protected <R> void supervisorLoop(Function<ConsumerRecord<K, V>, List<R>> userFu
                 } catch (Exception e) {
                     log.error("Error from poll control thread, will attempt controlled shutdown, then rethrow. Error: " + e.getMessage(), e);
                     doClose(DrainingCloseable.DEFAULT_TIMEOUT); // attempt to close
-                    throw new RuntimeException("Error from poll control thread: " + e.getMessage(), e);
+                    failureReason = new RuntimeException("Error from poll control thread: " + e.getMessage(), e);
+                    throw failureReason;
                 }
             }
             log.info("Control loop ending clean (state:{})...", state);
@@ -573,18 +610,14 @@ protected <R> void supervisorLoop(Function<ConsumerRecord<K, V>, List<R>> userFu
      */
     private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunction,
                                  Consumer<R> callback) throws TimeoutException, ExecutionException, InterruptedException {
-        if (state == running || state == draining) {
-            log.trace("Loop: Get work");
-            var records = wm.<R>maybeGetWork();
-
-            log.trace("Loop: Submit to pool");
-            submitWorkToPool(userFunction, callback, records);
-        }
+        handleWork(userFunction, callback);
 
         if (state == running) {
             if (!wm.isSufficientlyLoaded()) {
                 log.debug("Found not enough messages queued up, ensuring poller is awake");
                 brokerPollSubsystem.wakeup();
+            } else {
+                log.info("");
             }
         }
 
@@ -601,7 +634,7 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
         log.trace("Loop: Running {} loop end plugin(s)", controlLoopHooks.size());
         this.controlLoopHooks.forEach(Runnable::run);
 
-        log.debug("Current state: {}", state);
+        log.trace("Current state: {}", state);
         switch (state) {
             case draining -> {
                 drain();
@@ -614,8 +647,74 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
         // sanity - supervise the poller
         brokerPollSubsystem.supervise();
 
+        Duration duration = Duration.ofMillis(1);
+//        log.debug("Thread yield {}", duration);
+        try {
+            Thread.sleep(duration.toMillis());
+        } catch (InterruptedException e) {
+            log.debug("Woke up", e);
+        }
+
         // end of loop
-        log.trace("End of control loop, {} remaining in work manager. In state: {}", wm.getPartitionWorkRemainingCount(), state);
+        log.trace("End of control loop, waiting processing {}, remaining in partition queues: {}, out for processing: {}. In state: {}",
+                wm.getTotalWorkWaitingProcessing(), wm.getNumberOfEntriesInPartitionQueues(), wm.getRecordsOutForProcessing(), state);
+    }
+
+    RateLimiter rateLimiter = new RateLimiter();
+
+    private <R> void handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFunction, final Consumer<R> callback) {
+        if (state == running || state == draining) {
+            int dynamicExtraLoadFactorCurrent = dynamicExtraLoadFactor.getCurrent();
+            int target = getPoolQueueTarget() * dynamicExtraLoadFactorCurrent;
+            BlockingQueue<Runnable> queue = workerPool.getQueue();
+            int current = queue.size();
+            int delta = target - current;
+
+            log.debug("Loop: Get work - target: {} current queue size: {}, requesting: {}, loading factor: {}", target, current, delta, dynamicExtraLoadFactorCurrent);
+            var records = wm.<R>maybeGetWork(delta);
+
+            log.trace("Loop: Submit to pool");
+            submitWorkToPool(userFunction, callback, records);
+        }
+
+//        log.debug("Pool stats: {}", workerPool);
+
+        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
+            boolean steppedUp = dynamicExtraLoadFactor.maybeStepUp();
+            if (steppedUp) {
+                log.warn("Executor pool queue is not loaded with enough work (queue: {} vs target: {}), stepped up loading factor to {}",
+                        workerPool.getQueue().size(), getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrent());
+            } else if (dynamicExtraLoadFactor.isMaxReached()) {
+                log.warn("Max loading factor steps reached: {}/{}", dynamicExtraLoadFactor.getCurrent(), dynamicExtraLoadFactor.getMax());
+            }
+        }
+
+        rateLimiter.limit(() -> {
+            int queueSize = workerPool.getQueue().size();
+            log.info("Stats: \n- pool active: {} queued:{} \n- queue size: {} target: {} loading factor: {}",
+                    workerPool.getActiveCount(), queueSize, queueSize, getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrent());
+        });
+//        else if (dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
+//            log.warn("Executor pool queue is OK! {} vs {}",
+//                    workerPool.getQueue().size(), getPoolQueueTarget());
+//        }
+    }
+
+    /**
+     * @return aim to never have the pool queue drop below this
+     */
+    private int getPoolQueueTarget() {
+//        int loadingFactor = options.getLoadingFactor();
+//        return options.getNumberOfThreads() * loadingFactor;
+        return options.getNumberOfThreads();
+    }
+
+    private boolean isPoolQueueLow() {
+        double ninteyPercent = 0.9; // at least 90% of threads are utilised
+        boolean threadsUnderUtilised = workerPool.getActiveCount() < (options.getNumberOfThreads() * ninteyPercent);
+        return getPoolQueueTarget() > workerPool.getQueue().size()
+                && wm.isNotPartitionedOrDrained()
+                && threadsUnderUtilised;
     }
 
     private void drain() {
@@ -642,18 +741,23 @@ private void transitionToClosing() {
      * Can be interrupted if something else needs doing.
      */
     private void processWorkCompleteMailBox() {
-        log.trace("Processing mailbox (might block waiting or results)...");
+        log.trace("Processing mailbox (might block waiting for results)...");
         Set<WorkContainer<K, V>> results = new HashSet<>();
         final Duration timeout = getTimeToNextCommit(); // don't sleep longer than when we're expected to maybe commit
 
         // blocking get the head of the queue
         WorkContainer<K, V> firstBlockingPoll = null;
         try {
-            log.debug("Blocking poll on work until next scheduled offset commit attempt for {}", timeout);
-            currentlyPollingWorkCompleteMailBox.getAndSet(true);
-            // wait for work, with a timeout for sanity
-            firstBlockingPoll = workMailBox.poll(timeout.toMillis(), MILLISECONDS);
-            currentlyPollingWorkCompleteMailBox.getAndSet(false);
+            if (workMailBox.isEmpty()) {
+                log.debug("Blocking poll on work until next scheduled offset commit attempt for {}", timeout);
+                currentlyPollingWorkCompleteMailBox.getAndSet(true);
+                // wait for work, with a timeout for sanity
+                firstBlockingPoll = workMailBox.poll(timeout.toMillis(), MILLISECONDS);
+                currentlyPollingWorkCompleteMailBox.getAndSet(false);
+            } else {
+                // don't set the lock or log anything
+                firstBlockingPoll = workMailBox.poll();
+            }
         } catch (InterruptedException e) {
             log.debug("Interrupted waiting on work results");
         }
@@ -667,18 +771,19 @@ private void processWorkCompleteMailBox() {
         // see how big the queue is now, and poll that many times
         int size = workMailBox.size();
         log.trace("Draining {} more, got {} already...", size, results.size());
-        for (var ignore : range(size)) {
-            // #drainTo is nondeterministic during concurrent access - poll is more deterministic and we limit our loops to ensure progress, at the cost of some performance
-            WorkContainer<K, V> secondPollNonBlocking = null; // if we poll too many, don't block
-            try {
-                secondPollNonBlocking = workMailBox.poll(0, SECONDS);
-            } catch (InterruptedException e) {
-                log.debug("Interrupted waiting on work results", e);
-            }
-            if (secondPollNonBlocking != null) {
-                results.add(secondPollNonBlocking);
-            }
-        }
+        workMailBox.drainTo(results, size);
+//        for (var ignore : range(size)) {
+//            // #drainTo is nondeterministic during concurrent access - poll is more deterministic and we limit our loops to ensure progress, at the cost of some performance
+//            WorkContainer<K, V> secondPollNonBlocking = null; // if we poll too many, don't block
+//            try {
+//                secondPollNonBlocking = workMailBox.poll(0, SECONDS);
+//            } catch (InterruptedException e) {
+//                log.debug("Interrupted waiting on work results", e);
+//            }
+//            if (secondPollNonBlocking != null) {
+//                results.add(secondPollNonBlocking);
+//            }
+//        }
 
         log.trace("Processing drained work {}...", results.size());
         for (var work : results) {
@@ -694,11 +799,15 @@ private void processWorkCompleteMailBox() {
     private void commitOffsetsMaybe() {
         Duration elapsedSinceLast = getTimeSinceLastCommit();
         boolean commitFrequencyOK = toSeconds(elapsedSinceLast) >= toSeconds(timeBetweenCommits);
-        boolean shouldCommitNow = commitFrequencyOK || !lingeringOnCommitWouldBeBeneficial() || isCommandedToCommit();
+        boolean poolQueueLow = isPoolQueueLow();
+        boolean shouldCommitNow = commitFrequencyOK || !lingeringOnCommitWouldBeBeneficial() || isCommandedToCommit() || poolQueueLow;
         if (shouldCommitNow) {
             if (!commitFrequencyOK) {
                 log.debug("Commit too frequent, but no benefit in lingering");
             }
+            if (poolQueueLow)
+                // todo got to change this - commits are ever few ms
+                log.debug("Pool queue too low so committing offsets");
             commitOffsetsThatAreReady();
             lastCommit = Instant.now();
         } else {
@@ -825,8 +934,21 @@ protected <R> List<Tuple<ConsumerRecord<K, V>, R>> userFunctionRunner(Function<C
             addToMailbox(wc); // always add on error
             throw e; // trow again to make the future failed
         }
+//        finally {
+//            onWorkFunctionFinish();
+//        }
     }
 
+//    private void onWorkFunctionFinish() {
+//        checkEnoughWorkIsQueued()
+//    }
+//
+//    private void checkEnoughWorkIsQueued() {
+//        if (isPoolQueueLow()) {
+//            notifyNewWorkRegistered();
+//        }
+//    }
+
     protected void addToMailBoxOnUserFunctionSuccess(WorkContainer<K, V> wc, List<?> resultsFromUserFunction) {
         addToMailbox(wc);
     }
@@ -839,7 +961,6 @@ protected void onUserFunctionSuccess(WorkContainer<K, V> wc, List<?> resultsFrom
     protected void addToMailbox(WorkContainer<K, V> wc) {
         log.trace("Adding {} to mailbox...", wc);
         workMailBox.add(wc);
-        log.trace("Finished adding. {}", wc);
     }
 
     /**
@@ -865,7 +986,7 @@ void notifyNewWorkRegistered() {
 
     @Override
     public int workRemaining() {
-        return wm.getPartitionWorkRemainingCount();
+        return wm.getNumberOfEntriesInPartitionQueues();
     }
 
     /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java
new file mode 100644
index 000000000..ca3d894d3
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java
@@ -0,0 +1,34 @@
+package io.confluent.parallelconsumer;
+
+import lombok.SneakyThrows;
+
+import java.time.Duration;
+import java.util.concurrent.Callable;
+
+public class RateLimiter {
+
+    private Duration rate = Duration.ofSeconds(1);
+    private long lastFire = 0;
+
+    public RateLimiter() {
+    }
+
+    public RateLimiter(int seconds) {
+        this.rate = Duration.ofSeconds(seconds);
+    }
+
+    @SneakyThrows
+    public void limit(final Runnable action) {
+        if (isOkToCallAction()) {
+            lastFire = System.currentTimeMillis();
+            action.run();
+        }
+    }
+
+    private boolean isOkToCallAction() {
+        long now = System.currentTimeMillis();
+        long elapsed = now - lastFire;
+        return lastFire == 0 || elapsed > rate.toMillis();
+    }
+
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
new file mode 100644
index 000000000..2a45b5cba
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
@@ -0,0 +1,30 @@
+package io.confluent.parallelconsumer;
+
+public class WindowedEventRate {
+
+    private double normalizedRate; // event rate / window
+    private long windowSizeTicks;
+    private long lastEventTicks;
+
+
+    public WindowedEventRate(int aWindowSizeSeconds) {
+        windowSizeTicks = aWindowSizeSeconds * 1000L;
+        lastEventTicks = System.currentTimeMillis();
+    }
+
+    public double newEvent() {
+//        long currentTicks = System.currentTimeMillis();
+        long currentTicks = System.nanoTime();
+        long period = currentTicks - lastEventTicks;
+        lastEventTicks = currentTicks;
+        double normalizedFrequency = (double) windowSizeTicks / (double) period;
+
+        double alpha = Math.min(1.0 / normalizedFrequency, 1.0);
+        normalizedRate = (alpha * normalizedFrequency) + ((1.0 - alpha) * normalizedRate);
+        return getRate();
+    }
+
+    public double getRate() {
+        return normalizedRate * 1_000_000L / windowSizeTicks;
+    }
+}
\ No newline at end of file
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
index 6e541caf4..e517b36d4 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
@@ -50,7 +50,7 @@ public class WorkContainer<K, V> implements Comparable<WorkContainer> {
     private static Duration retryDelay = Duration.ofSeconds(10);
 
     @Getter
-    @Setter(AccessLevel.PACKAGE)
+    @Setter(AccessLevel.PUBLIC)
     private Future<List<Object>> future;
 
     public WorkContainer(ConsumerRecord<K, V> cr) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index 850c9cfa0..c85c86da0 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -9,7 +9,6 @@
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import lombok.Getter;
 import lombok.Setter;
-import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerRebalanceListener;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
@@ -19,8 +18,6 @@
 import pl.tlinkowski.unij.api.UniLists;
 import pl.tlinkowski.unij.api.UniSets;
 
-import java.time.Duration;
-import java.time.Instant;
 import java.util.*;
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.concurrent.ConcurrentSkipListMap;
@@ -65,10 +62,16 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      * <p>
      * Need to record globally consumed records, to ensure correct offset order committal. Cannot rely on incrementally
      * advancing offsets, as this isn't a guarantee of kafka's.
+     * <p>
+     * Concurrent because either the broker poller thread or the control thread may be requesting offset to commit
+     * ({@link #findCompletedEligibleOffsetsAndRemove})
      *
      * @see #findCompletedEligibleOffsetsAndRemove
      */
     private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new ConcurrentHashMap<>();
+    //    private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new HashMap<>();
+
+    private final BackoffAnalyser backoffer;
 
     /**
      * Iteration resume point, to ensure fairness (prevent shard starvation) when we can't process messages from every
@@ -76,11 +79,12 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      */
     private Optional<Object> iterationResumePoint = Optional.empty();
 
-    private int inFlightCount = 0;
+    private int recordsOutForProcessing = 0;
 
     /**
-     * The multiple of {@link ParallelConsumerOptions#getMaxMessagesToQueue()} that should be pre-loaded awaiting
-     * processing. Consumer already pipelines, so we shouldn't need to pipeline ourselves too much.
+     * todo docs
+     * The multiple that should be pre-loaded awaiting processing. Consumer already pipelines, so we shouldn't need to
+     * pipeline ourselves too much.
      * <p>
      * Note how this relates to {@link BrokerPollSystem#getLongPollTimeout()} - if longPollTimeout is high and loading
      * factor is low, there may not be enough messages queued up to satisfy demand.
@@ -108,7 +112,7 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     /**
      * The highest seen offset for a partition
      */
-    Map<TopicPartition, Long> partitionOffsetHighWaterMarks = new HashMap<TopicPartition, Long>();
+    Map<TopicPartition, Long> partitionOffsetHighWaterMarks = new HashMap<>();
 
     // visible for testing
     long MISSING_HIGH_WATER_MARK = -1L;
@@ -124,6 +128,8 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     public WorkManager(ParallelConsumerOptions options, org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
         this.options = options;
         this.consumer = consumer;
+
+        backoffer = new BackoffAnalyser(options.getNumberOfThreads() * 10);
     }
 
     /**
@@ -220,39 +226,153 @@ public void registerWork(ConsumerRecords<K, V> records) {
         workInbox.add(records);
     }
 
+    private final Queue<ConsumerRecords<K, V>> internalBatchMailQueue = new LinkedList<>();
+    private final Queue<ConsumerRecord<K, V>> internalFlattenedMailQueue = new LinkedList<>();
+
     /**
      * Take our inbound messages from the {@link BrokerPollSystem} and add them to our registry.
+     *
+     * @param requestedMaxWorkToRetrieve
      */
-    private void processInbox() {
-        ArrayList<ConsumerRecords<K, V>> mail = new ArrayList<>();
-        workInbox.drainTo(mail);
-        for (final ConsumerRecords<K, V> records : mail) {
-            processInbox(records);
+    private void processInbox(final int requestedMaxWorkToRetrieve) {
+        workInbox.drainTo(internalBatchMailQueue);
+
+        // flatten
+        while (!internalBatchMailQueue.isEmpty()) {
+            ConsumerRecords<K, V> consumerRecords = internalBatchMailQueue.poll();
+            log.debug("Flattening {} records", consumerRecords.count());
+            for (final ConsumerRecord<K, V> consumerRecord : consumerRecords) {
+                internalFlattenedMailQueue.add(consumerRecord);
+            }
+        }
+
+        //
+//        int inFlight = getNumberOfEntriesInPartitionQueues();
+//        int max = getMaxToGoBeyondOffset();
+//        int gap = max - inFlight;
+        int gap = requestedMaxWorkToRetrieve;
+        int taken = 0;
+
+//        log.debug("Will register {} (max configured: {}) records of work ({} already registered)", gap, max, inFlight);
+        log.debug("Will attempt to register {} - {} available", requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
+
+        //
+        while (taken < gap && !internalFlattenedMailQueue.isEmpty()) {
+            ConsumerRecord<K, V> poll = internalFlattenedMailQueue.poll();
+            processInbox(poll);
+            taken++;
         }
+
+        log.debug("{} new records were registered.", taken);
+
+//        ArrayList<ConsumerRecords<K, V>> toRemove = new ArrayList<>();
+//        for (final ConsumerRecords<K, V> records : internalBatchMailQueue) {
+//            records.
+//
+//        }
+//        boolean moreRecordsCanBeAccepted = processInbox(records);
+//        if (moreRecordsCanBeAccepted)
+//            toRemove.add(records);
+//        internalBatchMailQueue.removeAll(toRemove);
+    }
+
+    private int getMaxToGoBeyondOffset() {
+        return backoffer.getCurrentTotalMaxCountBeyondOffset();
     }
 
     /**
+     * @return true if the records were accepted, false if they cannot be
      * @see #processInbox()
      */
-    private void processInbox(ConsumerRecords<K, V> records) {
-        log.debug("Registering {} records of work", records.count());
+    private boolean processInbox(ConsumerRecords<K, V> records) {
+        int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
+        int recordsToAdd = records.count();
+        // we don't break up individual record sets (although we could, but "overhead") so need to queue up records even if it goes over by some amount
+        boolean overMax = partitionWorkRemainingCount - recordsToAdd >= getMaxToGoBeyondOffset();
+        if (overMax) {
+            log.debug("Work remaining in partition queues has surpassed max, so won't bring further messages in from the pipeline queued: {} / max: {}",
+                    partitionWorkRemainingCount, getMaxToGoBeyondOffset());
+            return false;
+        }
+
+//        if (!inboundOffsetWidthWithinRange(records)) {
+//            return false;
+//        }
+
+        //
+        log.debug("Registering {} records of work ({} already registered)", recordsToAdd, partitionWorkRemainingCount);
+
         for (ConsumerRecord<K, V> rec : records) {
-            if (isRecordPreviouslyProcessed(rec)) {
-                log.trace("Record previously processed, skipping. offset: {}", rec.offset());
-            } else {
-                Object shardKey = computeShardKey(rec);
-                long offset = rec.offset();
-                var wc = new WorkContainer<K, V>(rec);
+            processInbox(rec);
+        }
 
-                TopicPartition tp = toTP(rec);
-                raisePartitionHighWaterMark(offset, tp);
+        return true;
+    }
 
-                processingShards.computeIfAbsent(shardKey, (ignore) -> new ConcurrentSkipListMap<>()).put(offset, wc);
+    private boolean inboundOffsetWidthWithinRange(final ConsumerRecords<K, V> records) {
+        // brute force - surely very slow. surely this info can be cached?
+        Map<TopicPartition, List<ConsumerRecord<K, V>>> inbound = new HashMap<>();
+        for (final ConsumerRecord<K, V> record : records) {
+            TopicPartition tp = new TopicPartition(record.topic(), record.partition());
+            inbound.computeIfAbsent(tp, (ignore) -> new ArrayList<>()).add(record);
+        }
 
-                partitionCommitQueues.computeIfAbsent(tp, (ignore) -> new ConcurrentSkipListMap<>())
-                        .put(offset, wc);
+        Set<Map.Entry<TopicPartition, List<ConsumerRecord<K, V>>>> inboundPartitionQueues = inbound.entrySet();
+        for (final Map.Entry<TopicPartition, List<ConsumerRecord<K, V>>> inboundPartitionQueue : inboundPartitionQueues) {
+            // get highest start offset
+            long start = 0l;
+            TopicPartition tp = inboundPartitionQueue.getKey();
+            NavigableMap<Long, WorkContainer<K, V>> longWorkContainerNavigableMap = partitionCommitQueues.get(tp);
+            if (longWorkContainerNavigableMap != null) {
+                for (final Map.Entry<Long, WorkContainer<K, V>> longWorkContainerEntry : longWorkContainerNavigableMap.entrySet()) {
+                    WorkContainer<K, V> value = longWorkContainerEntry.getValue();
+                    boolean userFunctionSucceeded = value.isUserFunctionSucceeded();
+                    if (!userFunctionSucceeded) {
+                        start = value.getCr().offset();
+
+                        // now find any record what would make the width too big. Binary search?
+                        // brute force
+                        List<ConsumerRecord<K, V>> inboundRecordQueue = inboundPartitionQueue.getValue();
+//                        ConsumerRecord<K, V> highestOffsetInboundRecord = inboundRecordQueue.get(inboundRecordQueue.size() - 1);
+//                        long newEnd = highestOffsetInboundRecord.offset();
+
+                        for (final ConsumerRecord<K, V> inboundRecord : inboundRecordQueue) {
+                            long newEnd = inboundRecord.offset();
+                            long width = newEnd - start;
+
+                            if (width >= BitsetEncoder.MAX_LENGTH_ENCODABLE) {
+                                long oldWidth = partitionOffsetHighWaterMarks.get(tp) - start;
+                                // can't be more accurate unless we break up the inbound records and count them per queue
+                                log.debug("Incoming outstanding offset difference too large for BitSet encoder (incoming width: {}, old width: {}), will wait before adding these records until the width shrinks (below {})",
+                                        width, oldWidth, BitsetEncoder.MAX_LENGTH_ENCODABLE);
+                                return false;
+//                                break;
+                            } else {
+                                log.debug("Width was ok {}", width);
+                            }
+                        }
+                    }
+                }
             }
         }
+        return true;
+    }
+
+    private void processInbox(final ConsumerRecord<K, V> rec) {
+        if (isRecordPreviouslyProcessed(rec)) {
+            log.trace("Record previously processed, skipping. offset: {}", rec.offset());
+        } else {
+            Object shardKey = computeShardKey(rec);
+            long offset = rec.offset();
+            var wc = new WorkContainer<>(rec);
+
+            TopicPartition tp = toTP(rec);
+            raisePartitionHighWaterMark(offset, tp);
+
+            processingShards.computeIfAbsent(shardKey, (ignore) -> new ConcurrentSkipListMap<>()).put(offset, wc);
+
+            partitionCommitQueues.computeIfAbsent(tp, (ignore) -> new ConcurrentSkipListMap<>()).put(offset, wc);
+        }
     }
 
     void raisePartitionHighWaterMark(long highWater, TopicPartition tp) {
@@ -290,25 +410,26 @@ private Object computeShardKey(ConsumerRecord<K, V> rec) {
     }
 
     public <R> List<WorkContainer<K, V>> maybeGetWork() {
-        return maybeGetWork(options.getMaxMessagesToQueue());
+        return maybeGetWork(getMaxMessagesToQueue());
     }
 
     /**
      * Depth first work retrieval.
-     *
-     * @param requestedMaxWorkToRetrieve ignored unless less than {@link ParallelConsumerOptions#maxConcurrency}
      */
     public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
-        processInbox();
-
-        int minWorkToGetSetting = min(min(requestedMaxWorkToRetrieve, options.getMaxMessagesToQueue()), options.getMaxNumberMessagesBeyondBaseCommitOffset());
-        int workToGetDelta = minWorkToGetSetting - getInFlightCount();
+        //int minWorkToGetSetting = min(min(requestedMaxWorkToRetrieve, getMaxMessagesToQueue()), getMaxToGoBeyondOffset());
+//        int minWorkToGetSetting = min(requestedMaxWorkToRetrieve, getMaxToGoBeyondOffset());
+//        int workToGetDelta = requestedMaxWorkToRetrieve - getRecordsOutForProcessing();
+        int workToGetDelta = requestedMaxWorkToRetrieve;
 
         // optimise early
         if (workToGetDelta < 1) {
             return UniLists.of();
         }
 
+        int extraNeededFromInboxToSatisfy = requestedMaxWorkToRetrieve - getWorkQueuedInShardsCount();
+        processInbox(extraNeededFromInboxToSatisfy);
+
         //
         List<WorkContainer<K, V>> work = new ArrayList<>();
 
@@ -361,13 +482,28 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
         }
 
 
-        log.debug("Got {} records of work", work.size());
-        inFlightCount += work.size();
+        log.debug("Got {} records of work. In-flight: {}, Awaiting: {}", work.size(), getRecordsOutForProcessing(), getNumberOfEntriesInPartitionQueues());
+        recordsOutForProcessing += work.size();
 
         return work;
     }
 
+    private int getMaxMessagesToQueue() {
+        //return options.getNumberOfThreads() * options.getLoadingFactor();
+        double rate = successRatePer5Seconds.getRate();
+        int newRatae = (int) rate * 2;
+        int max = Math.max(newRatae, options.getNumberOfThreads() * 10);
+        log.debug("max to queue: {}", max);
+        return max;
+//        return options.getNumberOfThreads() * 10;
+    }
+
+    private final WindowedEventRate successRatePer5Seconds = new WindowedEventRate(5);
+    private final ExponentialMovingAverage successRatePer5SecondsEMA = new ExponentialMovingAverage(0.5);
+
     public void success(WorkContainer<K, V> wc) {
+        successRatePer5Seconds.newEvent();
+//        successRatePer5SecondsEMA.
         workStateIsDirtyNeedsCommitting.set(true);
         ConsumerRecord<K, V> cr = wc.getCr();
         log.trace("Work success ({}), removing from processing shard queue", wc);
@@ -375,15 +511,16 @@ public void success(WorkContainer<K, V> wc) {
         Object key = computeShardKey(cr);
         // remove from processing queues
         NavigableMap<Long, WorkContainer<K, V>> shard = processingShards.get(key);
-        shard.remove(cr.offset());
+        long offset = cr.offset();
+        shard.remove(offset);
         // If using KEY ordering, where the shard key is a message key, garbage collect old shard keys (i.e. KEY ordering we may never see a message for this key again)
         boolean keyOrdering = options.getOrdering().equals(KEY);
         if (keyOrdering && shard.isEmpty()) {
-            log.debug("Removing empty shard (key: {})", key);
+            log.trace("Removing empty shard (key: {})", key);
             processingShards.remove(key);
         }
         successfulWorkListeners.forEach((c) -> c.accept(wc)); // notify listeners
-        inFlightCount--;
+        recordsOutForProcessing--;
     }
 
     public void failed(WorkContainer<K, V> wc) {
@@ -401,10 +538,10 @@ private void putBack(WorkContainer<K, V> wc) {
         var shard = processingShards.get(key);
         long offset = wc.getCr().offset();
         shard.put(offset, wc);
-        inFlightCount--;
+        recordsOutForProcessing--;
     }
 
-    public int getPartitionWorkRemainingCount() {
+    public int getNumberOfEntriesInPartitionQueues() {
         int count = 0;
         for (var e : this.partitionCommitQueues.entrySet()) {
             count += e.getValue().size();
@@ -412,11 +549,40 @@ public int getPartitionWorkRemainingCount() {
         return count;
     }
 
-    public int getWorkRemainingCount() {
-        return getMappedShardWorkRemainingCount() + workInbox.stream().map(x -> x.count()).reduce(0, (a, b) -> a + b);
+    /**
+     * @return Work count in mailbox plus work added to the processing shards
+     */
+    public int getTotalWorkWaitingProcessing() {
+        return getWorkQueuedInShardsCount() + getWorkQueuedInMailboxCount();
     }
 
-    public int getMappedShardWorkRemainingCount() {
+    /**
+     * @return Work queued in the mail box, awaiting processing into shards
+     */
+    Integer getWorkQueuedInMailboxCount() {
+        int batchCount = 0;
+        for (final ConsumerRecords<K, V> inboxEntry : workInbox) {
+            batchCount += inboxEntry.count();
+        }
+//        for (final ConsumerRecords<K, V> consumerRecords : Collections.unmodifiableCollection(internalBatchMailQueue)) { // copy for concurrent access - as it holds batches of polled records, it should be relatively small
+        if (internalBatchMailQueue.size() > 10) {
+            log.warn("Larger than expected {}", internalBatchMailQueue.size());
+        }
+        for (final ConsumerRecords<K, V> consumerRecords : new ArrayList<>(internalBatchMailQueue)) { // copy for concurrent access - as it holds batches of polled records, it should be relatively small
+            if (consumerRecords != null) {
+                batchCount += consumerRecords.count();
+            }
+        }
+//        Integer batchCount = internalBatchMailQueue.stream()
+//                .map(ConsumerRecords::count)
+//                .reduce(0, Integer::sum);
+        return batchCount + internalFlattenedMailQueue.size();
+    }
+
+    /**
+     * @return Work ready in the processing shards, awaiting selection as work to do
+     */
+    public int getWorkQueuedInShardsCount() {
         int count = 0;
         for (var e : this.processingShards.entrySet()) {
             count += e.getValue().size();
@@ -425,13 +591,14 @@ public int getMappedShardWorkRemainingCount() {
     }
 
     boolean isRecordsAwaitingProcessing() {
-        int partitionWorkRemainingCount = getMappedShardWorkRemainingCount();
-        return partitionWorkRemainingCount > 0 || !workInbox.isEmpty();
+        int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
+        //return partitionWorkRemainingCount > 0 || !workInbox.isEmpty() || !internalMailQueue.isEmpty();
+        return partitionWorkRemainingCount > 0 || !internalBatchMailQueue.isEmpty() || !internalFlattenedMailQueue.isEmpty();
     }
 
     boolean isRecordsAwaitingToBeCommitted() {
         // todo could be improved - shouldn't need to count all entries if we simply want to know if there's > 0
-        int partitionWorkRemainingCount = getPartitionWorkRemainingCount();
+        int partitionWorkRemainingCount = getNumberOfEntriesInPartitionQueues();
         return partitionWorkRemainingCount > 0;
     }
 
@@ -447,13 +614,8 @@ Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove() {
         return findCompletedEligibleOffsetsAndRemove(true);
     }
 
-    /**
-     * Expensive operation to see if anything is committable.
-     * <p>
-     * TODO Replace with dirty check
-     */
     boolean hasCommittableOffsets() {
-        return findCompletedEligibleOffsetsAndRemove(false).size() != 0;
+        return isDirty();
     }
 
     /**
@@ -514,7 +676,7 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
 
             // offset map building
             // Get final offset data, build the the offset map, and replace it in our map of offset data to send
-            // TODO potential optimisation: store/compare the current incomplete offsets to the last committed ones, to know if this step is needed or not (new progress has been made)
+            // TODO potential optimisation: store/compare the current incomplete offsets to the last committed ones, to know if this step is needed or not (new progress has been made) - isdirty?
             if (!incompleteOffsets.isEmpty()) {
                 long offsetOfNextExpectedMessage;
                 OffsetAndMetadata finalOffsetOnly = offsetsToSend.get(topicPartitionKey);
@@ -533,6 +695,7 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
                     offsetsToSend.put(topicPartitionKey, offsetWithExtraMap);
                 } catch (EncodingNotSupportedException e) {
                     log.warn("No encodings could be used to encode the offset map, skipping. Warning: messages might be replayed on rebalance", e);
+                    backoffer.onFailure();
                 }
             }
 
@@ -571,15 +734,18 @@ private void maybeStripOffsetPayload(Map<TopicPartition, OffsetAndMetadata> offs
             log.warn("Offset map data too large (size: {}) to fit in metadata payload - stripping offset map out. " +
                             "See kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize = 4096",
                     totalOffsetMetaCharacterLength);
-            // strip payload
+            // strip all payloads
+            // todo iteratively strip the largest payloads until we're under the limit
             for (var entry : offsetsToSend.entrySet()) {
                 TopicPartition key = entry.getKey();
                 OffsetAndMetadata v = entry.getValue();
                 OffsetAndMetadata stripped = new OffsetAndMetadata(v.offset()); // meta data gone
                 offsetsToSend.replace(key, stripped);
             }
-        } else {
+            backoffer.onFailure();
+        } else if (totalOffsetMetaCharacterLength != 0) {
             log.debug("Offset map small enough to fit in payload: {} (max: {})", totalOffsetMetaCharacterLength, OffsetMapCodecManager.DefaultMaxMetadataSize);
+            backoffer.onSuccess();
         }
     }
 
@@ -606,19 +772,25 @@ public boolean shouldThrottle() {
         return isSufficientlyLoaded();
     }
 
+    /**
+     * @return true if there's enough messages downloaded from the broker already to satisfy the pipeline, false if more
+     *         should be downloaded (or pipelined in the Consumer)
+     */
     boolean isSufficientlyLoaded() {
-        int remaining = getPartitionWorkRemainingCount();
-        boolean loadedEnoughInPipeline = remaining > options.getMaxMessagesToQueue() * loadingFactor;
-        boolean overMaxUncommitted = remaining > options.getMaxNumberMessagesBeyondBaseCommitOffset();
+        int total = getTotalWorkWaitingProcessing();
+        int inPartitions = getNumberOfEntriesInPartitionQueues();
+        int maxBeyondOffset = getMaxToGoBeyondOffset();
+        boolean loadedEnoughInPipeline = total > maxBeyondOffset * loadingFactor;
+        boolean overMaxUncommitted = inPartitions >= maxBeyondOffset;
         boolean remainingIsSufficient = loadedEnoughInPipeline || overMaxUncommitted;
-        if (remainingIsSufficient) {
-            log.debug("loadedEnoughInPipeline {} || overMaxUncommitted {}", loadedEnoughInPipeline, overMaxUncommitted);
-        }
+//        if (remainingIsSufficient) {
+        log.debug("isSufficientlyLoaded? loadedEnoughInPipeline {} || overMaxUncommitted {}", loadedEnoughInPipeline, overMaxUncommitted);
+//        }
         return remainingIsSufficient;
     }
 
-    public int getInFlightCount() {
-        return inFlightCount;
+    public int getRecordsOutForProcessing() {
+        return recordsOutForProcessing;
     }
 
     public boolean workIsWaitingToBeCompletedSuccessfully() {
@@ -631,7 +803,7 @@ public boolean workIsWaitingToBeCompletedSuccessfully() {
     }
 
     public boolean hasWorkInFlight() {
-        return getInFlightCount() != 0;
+        return getRecordsOutForProcessing() != 0;
     }
 
     public boolean isClean() {
@@ -641,4 +813,9 @@ public boolean isClean() {
     private boolean isDirty() {
         return this.workStateIsDirtyNeedsCommitting.get();
     }
+
+    public boolean isNotPartitionedOrDrained() {
+        return getNumberOfEntriesInPartitionQueues() > 0 && getWorkQueuedInMailboxCount() > 0;
+
+    }
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
index b9e855ad3..2abb60ec2 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
@@ -4,6 +4,7 @@
  */
 package io.confluent.parallelconsumer.integrationTests;
 
+import io.confluent.csid.utils.ProgressBarUtils;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode;
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessorTestBase;
@@ -204,12 +205,7 @@ private void testTiming(int numberOfKeys, int quantityOfMessagesToProduce) {
         HashMap<Integer, List<ConsumerRecord<String, String>>> records = ku.generateRecords(keys, quantityOfMessagesToProduce);
         ku.send(consumerSpy, records);
 
-        ProgressBar bar = new ProgressBarBuilder().setInitialMax(quantityOfMessagesToProduce)
-                .showSpeed()
-                .setUnit("msgs", 1)
-                .setUpdateIntervalMillis(100)
-                .build();
-        bar.maxHint(quantityOfMessagesToProduce);
+        ProgressBar bar = ProgressBarUtils.getNewMessagesBar(log, quantityOfMessagesToProduce);
 
         Queue<ConsumerRecord<String, String>> processingCheck = new ConcurrentLinkedQueue<ConsumerRecord<String, String>>();
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
index 73f58c02c..919929438 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
@@ -4,12 +4,12 @@
  */
 package io.confluent.parallelconsumer.integrationTests;
 
-import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
+import io.confluent.csid.utils.ProgressBarUtils;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
+import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import me.tongfei.progressbar.ProgressBar;
-import me.tongfei.progressbar.ProgressBarBuilder;
 import org.apache.commons.lang3.RandomStringUtils;
 import org.apache.commons.lang3.RandomUtils;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
@@ -18,7 +18,7 @@
 import org.apache.kafka.clients.producer.ProducerRecord;
 import org.apache.kafka.clients.producer.RecordMetadata;
 import org.assertj.core.util.Lists;
-import org.junit.jupiter.api.*;
+import org.junit.jupiter.api.Test;
 import org.testcontainers.junit.jupiter.Testcontainers;
 import pl.tlinkowski.unij.api.UniLists;
 
@@ -31,7 +31,8 @@
 import static io.confluent.csid.utils.GeneralTestUtils.time;
 import static io.confluent.csid.utils.Range.range;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.TRANSACTIONAL_PRODUCER;
-import static java.time.Duration.*;
+import static java.time.Duration.ofMillis;
+import static java.time.Duration.ofSeconds;
 import static me.tongfei.progressbar.ProgressBar.wrap;
 import static org.apache.commons.lang3.RandomUtils.nextInt;
 import static org.assertj.core.api.Assertions.assertThat;
@@ -85,9 +86,7 @@ void asyncConsumeAndProcess() {
         ParallelEoSStreamProcessor<String, String> async = new ParallelEoSStreamProcessor<>(options);
         AtomicInteger msgCount = new AtomicInteger(0);
 
-        ProgressBar pb = new ProgressBarBuilder()
-                .setInitialMax(total).showSpeed().setTaskName("Read async").setUnit("msg", 1)
-                .build();
+        ProgressBar pb = ProgressBarUtils.getNewMessagesBar(log, total);
 
         try (pb) {
             async.poll(r -> {
@@ -118,9 +117,7 @@ private void readRecordsPlainConsumer(int total, String topic) {
         log.info("Starting to read back");
         final List<ConsumerRecord<String, String>> allRecords = Lists.newArrayList();
         time(() -> {
-            ProgressBar pb = new ProgressBarBuilder()
-                    .setInitialMax(total).showSpeed().setTaskName("Read").setUnit("msg", 1)
-                    .build();
+            ProgressBar pb = ProgressBarUtils.getNewMessagesBar(log, total);
 
             try (pb) {
                 await().atMost(ofSeconds(60)).untilAsserted(() -> {
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
index 1189bbef9..b4f94d598 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
@@ -4,6 +4,7 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.ProgressBarUtils;
 import io.confluent.csid.utils.StringUtils;
 import io.confluent.csid.utils.TrimListRepresentation;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
@@ -12,6 +13,7 @@
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
+import me.tongfei.progressbar.ProgressBar;
 import org.apache.commons.lang3.RandomUtils;
 import org.apache.kafka.clients.consumer.ConsumerConfig;
 import org.apache.kafka.clients.consumer.KafkaConsumer;
@@ -23,18 +25,17 @@
 import org.assertj.core.api.Assertions;
 import org.assertj.core.api.SoftAssertions;
 import org.awaitility.core.ConditionTimeoutException;
-import org.junit.jupiter.api.Disabled;
 import org.junit.jupiter.api.Test;
 
 import java.util.*;
 import java.util.concurrent.Future;
-import java.util.concurrent.TimeUnit;
 import java.util.concurrent.atomic.AtomicInteger;
 
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.TRANSACTIONAL_PRODUCER;
 import static java.time.Duration.ofSeconds;
 import static java.util.concurrent.TimeUnit.SECONDS;
-import static org.assertj.core.api.Assertions.*;
+import static org.assertj.core.api.Assertions.assertThat;
+import static org.assertj.core.api.Assertions.fail;
 import static org.awaitility.Awaitility.waitAtMost;
 import static pl.tlinkowski.unij.api.UniLists.of;
 
@@ -69,7 +70,7 @@ public class VeryLargeMessageVolumeTest extends BrokerIntegrationTest<String, St
      */
     @Test
     public void shouldNotThrowBitsetTooLongException() {
-        runTest(HIGH_MAX_POLL_RECORDS_CONFIG, CommitMode.CONSUMER_ASYNCHRONOUS, ProcessingOrder.UNORDERED);
+        runTest(HIGH_MAX_POLL_RECORDS_CONFIG, CommitMode.CONSUMER_ASYNCHRONOUS, ProcessingOrder.KEY);
     }
 
     @SneakyThrows
@@ -79,7 +80,8 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
         // pre-produce messages to input-topic
         List<String> expectedKeys = new ArrayList<>();
-        int expectedMessageCount = 1_000_000;
+//        int expectedMessageCount = 2_000_000;
+        int expectedMessageCount = 100_0000;
         log.info("Producing {} messages before starting test", expectedMessageCount);
         List<Future<RecordMetadata>> sends = new ArrayList<>();
         try (Producer<String, String> kafkaProducer = kcu.createNewProducer(false)) {
@@ -115,9 +117,12 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                 .consumer(newConsumer)
                 .producer(newProducer)
                 .commitMode(commitMode)
-                .numberOfThreads(100)
-                .maxNumberMessagesBeyondBaseCommitOffset(10_000)
-                .maxMessagesToQueue(10_000)
+//                .numberOfThreads(1)
+                .numberOfThreads(1000)
+//                .softMaxNumberMessagesBeyondBaseCommitOffset(100_000)
+//                .softMaxNumberMessagesBeyondBaseCommitOffset(10_000)
+//                .maxMessagesToQueue(10_000)
+//                .maxMessagesToQueue(6_000)
                 .build());
         pc.subscribe(of(inputName));
 
@@ -129,8 +134,27 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
         assertThat(beginOffsets.get(tp)).isEqualTo(0L);
 
 
+        ProgressBar bar = ProgressBarUtils.getNewMessagesBar(log, expectedMessageCount);
         pc.pollAndProduce(record -> {
-                    log.trace("Still going {}", record);
+//                    try {
+//                        Thread.sleep(5);
+//                    } catch (InterruptedException e) {
+//                        e.printStackTrace();
+//                    }
+                    try {
+                        // 1/5 chance of taking a long time
+                        int chance = 10;
+                        int dice = RandomUtils.nextInt(0, chance);
+                        if (dice == 0) {
+                            Thread.sleep(100);
+                        } else {
+                            Thread.sleep(RandomUtils.nextInt(3, 20));
+                        }
+//                        Thread.sleep(5);
+                    } catch (InterruptedException e) {
+                        e.printStackTrace();
+                    }
+                    bar.stepBy(1);
                     consumedKeys.add(record.key());
                     processedCount.incrementAndGet();
                     return new ProducerRecord<>(outputName, record.key(), "data");
@@ -140,17 +164,18 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                 }
         );
 
+
         // wait for all pre-produced messages to be processed and produced
         Assertions.useRepresentation(new TrimListRepresentation());
         var failureMessage = StringUtils.msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
-            waitAtMost(ofSeconds(120))
-                    // .failFast(()->pc.isClosedOrFailed()) requires https://github.com/awaitility/awaitility/issues/178#issuecomment-734769761
+            waitAtMost(ofSeconds(1200))
+                    .failFast(() -> pc.isClosedOrFailed(), () -> pc.getFailureCause()) // requires https://github.com/awaitility/awaitility/issues/178#issuecomment-734769761
                     .alias(failureMessage)
                     .pollInterval(1, SECONDS)
                     .untilAsserted(() -> {
-                        log.info("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
+                        log.trace("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
                         SoftAssertions all = new SoftAssertions();
                         all.assertThat(new ArrayList<>(consumedKeys)).as("all expected are consumed").hasSameSizeAs(expectedKeys);
                         all.assertThat(new ArrayList<>(producedKeysAcknowledged)).as("all consumed are produced ok ").hasSameSizeAs(expectedKeys);
@@ -160,6 +185,8 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
             fail(failureMessage + "\n" + e.getMessage());
         }
 
+        bar.close();
+
         pc.closeDrainFirst();
 
         assertThat(processedCount.get())
@@ -169,6 +196,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
         // sanity
         assertThat(expectedMessageCount).isEqualTo(processedCount.get());
         assertThat(producedKeysAcknowledged).hasSameSizeAs(expectedKeys);
+
     }
 
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/sanity/ProgressBarTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/sanity/ProgressBarTest.java
index eccf54d8f..9b1eb5171 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/sanity/ProgressBarTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/sanity/ProgressBarTest.java
@@ -4,6 +4,7 @@
  */
 package io.confluent.parallelconsumer.integrationTests.sanity;
 
+import io.confluent.csid.utils.ProgressBarUtils;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import me.tongfei.progressbar.DelegatingProgressBarConsumer;
@@ -22,9 +23,7 @@ public class ProgressBarTest {
     @Test
     @Disabled("For reference sanity only")
     public void width() {
-        DelegatingProgressBarConsumer delegatingProgressBarConsumer = new DelegatingProgressBarConsumer(log::info);
-
-        ProgressBar build = new ProgressBarBuilder().setConsumer(delegatingProgressBarConsumer).setInitialMax(100).showSpeed().setTaskName("progress").setUnit("msg", 1).build();
+        ProgressBar build = ProgressBarUtils.getNewMessagesBar(log, 100);
         try (build) {
             while (build.getCurrent() < build.getMax()) {
                 build.step();
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
index 675e908e6..309fa795d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
@@ -5,6 +5,8 @@
  */
 
 import io.confluent.parallelconsumer.OffsetMapCodecManager;
+import io.confluent.parallelconsumer.WorkContainer;
+import io.confluent.parallelconsumer.WorkManager;
 import lombok.Getter;
 import lombok.RequiredArgsConstructor;
 import lombok.Setter;
@@ -19,6 +21,7 @@
 import pl.tlinkowski.unij.api.UniLists;
 
 import java.util.*;
+import java.util.concurrent.FutureTask;
 import java.util.concurrent.atomic.AtomicReference;
 import java.util.stream.Collectors;
 
@@ -162,7 +165,7 @@ public List<ConsumerRecord<String, String>> generateRecords(int quantity) {
      */
     public HashMap<Integer, List<ConsumerRecord<String, String>>> generateRecords(List<Integer> keys, int quantity) {
         var keyRecords = new HashMap<Integer, List<ConsumerRecord<String, String>>>(quantity);
-        List<Integer> keyWork = UniLists.copyOf(keys);
+//        List<Integer> keyWork = UniLists.copyOf(keys);
 
         int count = 0;
         while (count < quantity) {
@@ -235,4 +238,26 @@ public void send(MockConsumer<String, String> consumerSpy, List<ConsumerRecord<S
             consumerSpy.addRecord(record);
         }
     }
+
+
+    public static void completeWork(final WorkManager<String, String> wmm, List<WorkContainer<String, String>> work, long offset) {
+        WorkContainer<String, String> foundWork = work.stream()
+                .filter(x ->
+                        x.getCr().offset() == offset
+                )
+                .findFirst().get();
+        KafkaTestUtils.completeWork(wmm, foundWork);
+    }
+
+    public static void completeWork(final WorkManager<String, String> wmm, final WorkContainer<String, String> wc) {
+        FutureTask future = new FutureTask<>(() -> {
+            return true;
+        });
+        future.run();
+        assertThat(future).isDone();
+        wc.setFuture(future);
+        wc.onUserFunctionSuccess();
+        wmm.success(wc);
+        assertThat(wc.isUserFunctionComplete()).isTrue();
+    }
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressBarUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressBarUtils.java
new file mode 100644
index 000000000..91bcbb1b6
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressBarUtils.java
@@ -0,0 +1,25 @@
+package io.confluent.csid.utils;
+
+import lombok.experimental.UtilityClass;
+import me.tongfei.progressbar.DelegatingProgressBarConsumer;
+import me.tongfei.progressbar.ProgressBar;
+import me.tongfei.progressbar.ProgressBarBuilder;
+import org.slf4j.Logger;
+
+@UtilityClass
+public class ProgressBarUtils
+{
+    public static ProgressBar getNewMessagesBar(Logger log, int initialMax) {
+        DelegatingProgressBarConsumer delegatingProgressBarConsumer = new DelegatingProgressBarConsumer(log::info);
+
+        int max = 100;
+        ProgressBar build = new ProgressBarBuilder()
+                .setConsumer(delegatingProgressBarConsumer)
+                .setInitialMax(initialMax)
+                .showSpeed()
+                .setTaskName("progress")
+                .setUnit("msg", 1)
+                .build();
+        return build;
+    }
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
new file mode 100644
index 000000000..8961877bf
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
@@ -0,0 +1,84 @@
+package io.confluent.parallelconsumer;
+
+import io.confluent.csid.utils.KafkaTestUtils;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.clients.consumer.ConsumerRecords;
+import org.apache.kafka.common.TopicPartition;
+import org.junit.jupiter.api.Test;
+
+import java.util.Collections;
+import java.util.Comparator;
+import java.util.HashMap;
+import java.util.List;
+
+import static org.assertj.core.api.Assertions.assertThat;
+
+public class BackPressureTests extends ParallelEoSStreamProcessorTestBase {
+
+    /**
+     * Tests that the backpressure system works correctly
+     * - that when max queued messages are reached, more aren't queued up
+     * - that more records aren't added for processing than are desired via settings.
+     */
+    @Test
+    void backPressureShouldPreventTooManyMessagesBeingQueuedForProcessing() {
+        // mock messages downloaded for processing > MAX_TO_QUEUE
+        // make sure work manager doesn't queue more than MAX_TO_QUEUE
+        final int numRecords = 1_000;
+
+        //
+        int maxInFlight = 200;
+        int maxQueue = 100;
+        ParallelConsumerOptions<String, String> build = ParallelConsumerOptions.<String, String>builder()
+//                .softMaxNumberMessagesBeyondBaseCommitOffset(maxInFlight)
+//                .maxMessagesToQueue(maxQueue)
+                .build();
+        WorkManager<String, String> wm = new WorkManager<>(build, consumerSpy);
+
+        // add records
+        {
+            ConsumerRecords<String, String> crs = buildConsumerRecords(numRecords);
+            wm.registerWork(crs);
+        }
+
+        //
+        {
+            List<WorkContainer<String, String>> work = wm.maybeGetWork();
+            assertThat(work).hasSize(maxQueue);
+            assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(maxInFlight);
+
+            KafkaTestUtils.completeWork(wm, work, 50);
+            KafkaTestUtils.completeWork(wm, work, 55);
+        }
+
+        // add more records
+        {
+            assertThat(wm.shouldThrottle()).isTrue();
+            assertThat(wm.isSufficientlyLoaded()).isTrue();
+            ConsumerRecords<String, String> crs = buildConsumerRecords(numRecords);
+            wm.registerWork(crs);
+            assertThat(wm.getNumberOfEntriesInPartitionQueues()).as("Hasn't increased").isEqualTo(maxInFlight);
+        }
+
+        // get more work
+        {
+            List<WorkContainer<String, String>> workContainers = wm.maybeGetWork();
+            assertThat(workContainers).hasSize(2);
+            assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(maxInFlight);
+            assertThat(wm.shouldThrottle()).isTrue();
+            assertThat(wm.isSufficientlyLoaded()).isTrue();
+        }
+
+    }
+
+    private ConsumerRecords<String, String> buildConsumerRecords(final int numRecords) {
+        List<ConsumerRecord<String, String>> consumerRecords = ktu.generateRecords(numRecords);
+        Collections.sort(consumerRecords, Comparator.comparingLong(ConsumerRecord::offset));
+        HashMap<TopicPartition, List<ConsumerRecord<String, String>>> recordsMap = new HashMap<>();
+        TopicPartition tp = new TopicPartition(INPUT_TOPIC, 0);
+        recordsMap.put(tp, consumerRecords);
+        ConsumerRecords<String, String> crs = new ConsumerRecords<>(recordsMap);
+        return crs;
+    }
+
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
index b51a9f611..8c7990153 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
@@ -1,5 +1,6 @@
 package io.confluent.parallelconsumer;
 
+import io.confluent.csid.utils.KafkaTestUtils;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
@@ -140,10 +141,10 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
         //
         ParallelConsumerOptions options = parallelConsumer.getWm().getOptions();
-        HashMap<TopicPartition, List<ConsumerRecord<String, String>>> objectObjectHashMap = new HashMap<>();
+        HashMap<TopicPartition, List<ConsumerRecord<String, String>>> recordsMap = new HashMap<>();
         TopicPartition tp = new TopicPartition(INPUT_TOPIC, 0);
-        objectObjectHashMap.put(tp, records);
-        ConsumerRecords<String, String> crs = new ConsumerRecords<>(objectObjectHashMap);
+        recordsMap.put(tp, records);
+        ConsumerRecords<String, String> crs = new ConsumerRecords<>(recordsMap);
 
         // write offsets
         Map<TopicPartition, OffsetAndMetadata> completedEligibleOffsetsAndRemove;
@@ -153,11 +154,11 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
             List<WorkContainer<String, String>> work = wmm.maybeGetWork();
 
-            completeWork(wmm, work, 0);
+            KafkaTestUtils.completeWork(wmm, work, 0);
 
-            completeWork(wmm, work, 69);
+            KafkaTestUtils.completeWork(wmm, work, 69);
 
-            completeWork(wmm, work, 25_000);
+            KafkaTestUtils.completeWork(wmm, work, 25_000);
 
             completedEligibleOffsetsAndRemove = wmm.findCompletedEligibleOffsetsAndRemove();
 
@@ -194,27 +195,6 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         }
     }
 
-    private void completeWork(final WorkManager<String, String> wmm, List<WorkContainer<String, String>> work, long offset) {
-        WorkContainer<String, String> foundWork = work.stream()
-                .filter(x ->
-                        x.getCr().offset() == offset
-                )
-                .findFirst().get();
-        completeWork(wmm, foundWork);
-    }
-
-    private void completeWork(final WorkManager<String, String> wmm, final WorkContainer<String, String> wc) {
-        FutureTask future = new FutureTask<>(() -> {
-            return true;
-        });
-        future.run();
-        assertThat(future).isDone();
-        wc.setFuture(future);
-        wc.onUserFunctionSuccess();
-        wmm.success(wc);
-        assertThat(wc.isUserFunctionComplete()).isTrue();
-    }
-
     /**
      * This version of non sequential test just test the encoder directly, and is only half the story, as at the
      * encoding stage they don't know which offsets have never been seen, and assume simply working with continuous
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
index 944a6dbac..4ac11be7a 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
@@ -12,7 +12,6 @@
 import org.apache.kafka.clients.consumer.ConsumerRecords;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.clients.producer.ProducerRecord;
-import org.apache.kafka.common.TopicPartition;
 import org.junit.jupiter.api.BeforeEach;
 import org.junit.jupiter.api.Disabled;
 import org.junit.jupiter.api.Test;
@@ -21,7 +20,6 @@
 import org.junit.jupiter.params.provider.EnumSource;
 import org.mockito.ArgumentMatchers;
 import org.mockito.Mockito;
-import pl.tlinkowski.unij.api.UniLists;
 
 import java.time.Duration;
 import java.util.*;
@@ -39,7 +37,6 @@
 import static java.util.concurrent.TimeUnit.SECONDS;
 import static org.assertj.core.api.Assertions.*;
 import static org.awaitility.Awaitility.await;
-import static org.awaitility.Awaitility.setDefaultConditionEvaluationListener;
 import static org.mockito.ArgumentMatchers.any;
 import static org.mockito.Mockito.*;
 import static org.mockito.internal.verification.VerificationModeFactory.times;
@@ -106,7 +103,7 @@ public void offsetsAreNeverCommittedForMessagesStillInFlightSimplest(CommitMode
 
         awaitLatch(startBarrierLatch);
 
-        assertThat(parallelConsumer.getWm().getInFlightCount()).isEqualTo(2);
+        assertThat(parallelConsumer.getWm().getRecordsOutForProcessing()).isEqualTo(2);
 
         // finish processing 1
         releaseAndWait(locks, 1);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
index 3b0a2b753..6ab3b3102 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
@@ -31,6 +31,7 @@
 import static io.confluent.parallelconsumer.WorkContainer.getRetryDelay;
 import static java.time.Duration.ofSeconds;
 import static org.assertj.core.api.Assertions.assertThat;
+import static org.assertj.core.api.Assertions.fail;
 import static pl.tlinkowski.unij.api.UniLists.of;
 
 /**
@@ -318,7 +319,7 @@ public void maxPerTopic() {
     public void maxInFlight() {
         //
         var opts = ParallelConsumerOptions.builder();
-        opts.maxNumberMessagesBeyondBaseCommitOffset(1);
+//        opts.softMaxNumberMessagesBeyondBaseCommitOffset(1);
         setupWorkManager(opts.build());
 
         //
@@ -333,7 +334,7 @@ public void maxInFlight() {
     public void maxConcurrency() {
         //
         var opts = ParallelConsumerOptions.builder();
-        opts.maxMessagesToQueue(1);
+//        opts.maxMessagesToQueue(1);
         setupWorkManager(opts.build());
 
         //
@@ -372,8 +373,8 @@ public void maxConcurrencyVsInFlightAndNoLeaks() {
         var opts = ParallelConsumerOptions.builder();
         opts.ordering(UNORDERED);
 
-        opts.maxNumberMessagesBeyondBaseCommitOffset(3);
-        opts.maxMessagesToQueue(2);
+//        opts.softMaxNumberMessagesBeyondBaseCommitOffset(3);
+//        opts.maxMessagesToQueue(2);
 
         setupWorkManager(opts.build());
 
@@ -383,7 +384,7 @@ public void maxConcurrencyVsInFlightAndNoLeaks() {
         registerSomeWork();
 
         //
-        assertThat(wm.getWorkRemainingCount()).isEqualTo(9);
+        assertThat(wm.getTotalWorkWaitingProcessing()).isEqualTo(9);
 
         //
         var work = new FluentQueue<WorkContainer<String, String>>();
@@ -422,9 +423,9 @@ public void maxConcurrencyVsInFlightAndNoLeaks() {
         Assertions.assertThat(work.add(wm.maybeGetWork(10))).hasSize(2);
 
         //
-        assertThat(wm.getInFlightCount()).isEqualTo(2);
-        assertThat(wm.getPartitionWorkRemainingCount()).isEqualTo(9);
-        assertThat(wm.getMappedShardWorkRemainingCount()).isEqualTo(4);
+        assertThat(wm.getRecordsOutForProcessing()).isEqualTo(2);
+        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(9);
+        assertThat(wm.getWorkQueuedInShardsCount()).isEqualTo(4);
         Assertions.assertThat(successfulWork).hasSize(5);
 
         //
@@ -439,9 +440,9 @@ public void maxConcurrencyVsInFlightAndNoLeaks() {
         //
         assertThat(work.size()).isEqualTo(0);
         Assertions.assertThat(successfulWork).hasSize(9);
-        assertThat(wm.getInFlightCount()).isEqualTo(0);
-        assertThat(wm.getMappedShardWorkRemainingCount()).isEqualTo(0);
-        assertThat(wm.getPartitionWorkRemainingCount()).isEqualTo(9);
+        assertThat(wm.getRecordsOutForProcessing()).isEqualTo(0);
+        assertThat(wm.getWorkQueuedInShardsCount()).isEqualTo(0);
+        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(9);
     }
 
     @Test
@@ -609,8 +610,8 @@ public void treeMapOrderingCorrect() {
     public void workQueuesEmptyWhenAllWorkComplete() {
         ParallelConsumerOptions build = ParallelConsumerOptions.builder()
                 .ordering(UNORDERED)
-                .maxMessagesToQueue(10)
-                .maxNumberMessagesBeyondBaseCommitOffset(10)
+//                .maxMessagesToQueue(10)
+//                .softMaxNumberMessagesBeyondBaseCommitOffset(10)
                 .build();
         setupWorkManager(build);
         registerSomeWork();
@@ -626,12 +627,13 @@ public void workQueuesEmptyWhenAllWorkComplete() {
         }
 
         //
-        assertThat(wm.getMappedShardWorkRemainingCount()).isZero();
-        assertThat(wm.getPartitionWorkRemainingCount()).isEqualTo(3);
+        assertThat(wm.getWorkQueuedInShardsCount()).isZero();
+        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(3);
 
         // drain commit queue
         var completedFutureOffsets = wm.findCompletedEligibleOffsetsAndRemove();
         assertThat(completedFutureOffsets).hasSize(1); // coalesces (see log)
-        assertThat(wm.getPartitionWorkRemainingCount()).isEqualTo(0);
+        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(0);
     }
+
 }
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 0bc43b470..0af549ed2 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -29,8 +29,8 @@
     <logger name="io.confluent.parallelconsumer" level="info"/>
 <!--    <logger name="io.confluent.parallelconsumer" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer" level="trace"/>-->
-    <!--        <logger name="io.confluent.parallelconsumer.ParallelEoSStreamProcessor" level="trace"/>-->
-    <!--    <logger name="io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest" level="info"/> &lt;!&ndash; docker logs &ndash;&gt;-->
+<!--            <logger name="io.confluent.parallelconsumer.ParallelEoSStreamProcessor" level="debug"/>-->
+<!--        <logger name="io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest" level="info"/> &lt;!&ndash; docker logs &ndash;&gt;-->
     <!--    <logger name="io.confluent.csid" level="info"/>-->
     <!--    <logger name="io.confluent.csid.utils" level="debug"/>-->
     <!--    <logger name="io.confluent.csid" level="debug"/>-->
@@ -45,7 +45,7 @@
     <!--    <logger name="io.confluent.parallelconsumer.ParallelConsumer" level="info" />-->
     <!--    <logger name="io.confluent.parallelconsumer.OffsetMapCodecManager" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.WorkManagerOffsetMapCodecManagerTest" level="debug"/>-->
-    <logger name="io.confluent.parallelconsumer.OffsetRunLength" level="trace"/>
+<!--    <logger name="io.confluent.parallelconsumer.OffsetRunLength" level="trace"/>-->
 
     <!-- containers -->
     <!--    <logger name="io.confluent.parallelconsumer.integrationTests.DbTest" level="debug"/>-->
diff --git a/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java b/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
index a109eabef..3c31d2b7a 100644
--- a/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
+++ b/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
@@ -12,17 +12,11 @@
 import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.clients.consumer.KafkaConsumer;
-import org.apache.kafka.clients.consumer.MockConsumer;
 import org.apache.kafka.clients.producer.KafkaProducer;
 import org.apache.kafka.clients.producer.Producer;
 import org.apache.kafka.clients.producer.ProducerRecord;
-import pl.tlinkowski.unij.api.UniLists;
 
-import java.util.ArrayList;
-import java.util.Collections;
-import java.util.List;
 import java.util.Properties;
-import java.util.concurrent.atomic.AtomicInteger;
 
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static pl.tlinkowski.unij.api.UniLists.of;
@@ -72,8 +66,8 @@ ParallelStreamProcessor<String, String> setupParallelConsumer() {
 
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(KEY) // <2>
-                .maxMessagesToQueue(1000) // <3>
-                .maxNumberMessagesBeyondBaseCommitOffset(1000) // <4>
+//                .maxMessagesToQueue(1000) // <3>
+//                .softMaxNumberMessagesBeyondBaseCommitOffset(1000) // <4>
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
diff --git a/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java b/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java
index 7bf6e00b5..39af4306d 100644
--- a/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java
+++ b/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java
@@ -82,8 +82,8 @@ private void setupParallelConsumer() {
         Producer<String, String> kafkaProducer = getKafkaProducer();
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(ParallelConsumerOptions.ProcessingOrder.KEY)
-                .maxMessagesToQueue(1000)
-                .maxNumberMessagesBeyondBaseCommitOffset(10000)
+//                .maxMessagesToQueue(1000)
+//                .softMaxNumberMessagesBeyondBaseCommitOffset(10000)
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
diff --git a/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java b/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java
index e0e0e58d3..ae4bc6140 100644
--- a/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java
+++ b/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java
@@ -41,8 +41,8 @@ void run() {
         Producer<String, String> kafkaProducer = getKafkaProducer();
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(ParallelConsumerOptions.ProcessingOrder.KEY)
-                .maxMessagesToQueue(1000)
-                .maxNumberMessagesBeyondBaseCommitOffset(10000)
+//                .maxMessagesToQueue(1000)
+//                .softMaxNumberMessagesBeyondBaseCommitOffset(10000)
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
diff --git a/pom.xml b/pom.xml
index 6080e16d1..551bd47e5 100644
--- a/pom.xml
+++ b/pom.xml
@@ -328,7 +328,7 @@
             <dependency>
                 <groupId>org.awaitility</groupId>
                 <artifactId>awaitility</artifactId>
-                <version>4.0.3</version>
+                <version>4.0.4-SNAPSHOT</version>
                 <scope>test</scope>
             </dependency>
             <dependency>

From 286b2eed4a226f9f2221f98bf0cbab642c186ed1 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 7 Dec 2020 20:26:01 +0000
Subject: [PATCH 002/131] Minor cleanup

---
 CHANGELOG.adoc                                |   2 +
 README.adoc                                   |   2 -
 .../parallelconsumer/BrokerPollSystem.java    |   3 -
 .../ExponentialMovingAverage.java             |  21 ---
 .../parallelconsumer/WindowedEventRate.java   |  30 -----
 .../parallelconsumer/WorkManager.java         | 120 +++++++++---------
 .../VeryLargeMessageVolumeTest.java           |  28 ++--
 .../examples/core/CoreApp.java                |   2 -
 pom.xml                                       |   2 +-
 9 files changed, 75 insertions(+), 135 deletions(-)
 delete mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
 delete mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java

diff --git a/CHANGELOG.adoc b/CHANGELOG.adoc
index dc097e3ab..da8d0e595 100644
--- a/CHANGELOG.adoc
+++ b/CHANGELOG.adoc
@@ -4,6 +4,8 @@
 
 * Features:
 ** Queueing and pressure system now self tuning, performance over default old tuning values (`softMaxNumberMessagesBeyondBaseCommitOffset` and `maxMessagesToQueue`) has doubled.
+*** These options have been removed from the system.
+
 * Improvements
 ** https://github.com/confluentinc/parallel-consumer/issues/37[Support BitSet encoding lengths longer than Short.MAX_VALUE #37] - adds new serialisation formats that supports wider range of offsets - (32,767 vs  2,147,483,647) for both BitSet and run-length encoding
 
diff --git a/README.adoc b/README.adoc
index a97d672bc..fb952f843 100644
--- a/README.adoc
+++ b/README.adoc
@@ -380,8 +380,6 @@ Where `${project.version}` is the version to be used:
 
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(KEY) // <2>
-                .maxMessagesToQueue(1000) // <3>
-                .softMaxNumberMessagesBeyondBaseCommitOffset(1000) // <4>
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
index 7e31440bf..cb8b4c162 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
@@ -103,9 +103,6 @@ private boolean controlLoop() {
                     if (!polledRecords.isEmpty()) {
                         log.trace("Loop: Register work");
                         wm.registerWork(polledRecords);
-
-                        // notify control work has been registered
-//                        pc.notifyNewWorkRegistered();
                     }
                 }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
deleted file mode 100644
index ec186ed7b..000000000
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
+++ /dev/null
@@ -1,21 +0,0 @@
-package io.confluent.parallelconsumer;
-
-public class ExponentialMovingAverage {
-
-    private double alpha;
-    private Double oldValue;
-
-    public ExponentialMovingAverage(double alpha) {
-        this.alpha = alpha;
-    }
-
-    public double average(double value) {
-        if (oldValue == null) {
-            oldValue = value;
-            return value;
-        }
-        double newValue = oldValue + alpha * (value - oldValue);
-        oldValue = newValue;
-        return newValue;
-    }
-}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
deleted file mode 100644
index 2a45b5cba..000000000
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
+++ /dev/null
@@ -1,30 +0,0 @@
-package io.confluent.parallelconsumer;
-
-public class WindowedEventRate {
-
-    private double normalizedRate; // event rate / window
-    private long windowSizeTicks;
-    private long lastEventTicks;
-
-
-    public WindowedEventRate(int aWindowSizeSeconds) {
-        windowSizeTicks = aWindowSizeSeconds * 1000L;
-        lastEventTicks = System.currentTimeMillis();
-    }
-
-    public double newEvent() {
-//        long currentTicks = System.currentTimeMillis();
-        long currentTicks = System.nanoTime();
-        long period = currentTicks - lastEventTicks;
-        lastEventTicks = currentTicks;
-        double normalizedFrequency = (double) windowSizeTicks / (double) period;
-
-        double alpha = Math.min(1.0 / normalizedFrequency, 1.0);
-        normalizedRate = (alpha * normalizedFrequency) + ((1.0 - alpha) * normalizedRate);
-        return getRate();
-    }
-
-    public double getRate() {
-        return normalizedRate * 1_000_000L / windowSizeTicks;
-    }
-}
\ No newline at end of file
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index c85c86da0..e50e1e7c7 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -71,7 +71,7 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new ConcurrentHashMap<>();
     //    private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new HashMap<>();
 
-    private final BackoffAnalyser backoffer;
+//    private final BackoffAnalyser backoffer;
 
     /**
      * Iteration resume point, to ensure fairness (prevent shard starvation) when we can't process messages from every
@@ -129,7 +129,7 @@ public WorkManager(ParallelConsumerOptions options, org.apache.kafka.clients.con
         this.options = options;
         this.consumer = consumer;
 
-        backoffer = new BackoffAnalyser(options.getNumberOfThreads() * 10);
+//        backoffer = new BackoffAnalyser(options.getNumberOfThreads() * 10);
     }
 
     /**
@@ -275,39 +275,39 @@ private void processInbox(final int requestedMaxWorkToRetrieve) {
 //            toRemove.add(records);
 //        internalBatchMailQueue.removeAll(toRemove);
     }
-
-    private int getMaxToGoBeyondOffset() {
-        return backoffer.getCurrentTotalMaxCountBeyondOffset();
-    }
-
-    /**
-     * @return true if the records were accepted, false if they cannot be
-     * @see #processInbox()
-     */
-    private boolean processInbox(ConsumerRecords<K, V> records) {
-        int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
-        int recordsToAdd = records.count();
-        // we don't break up individual record sets (although we could, but "overhead") so need to queue up records even if it goes over by some amount
-        boolean overMax = partitionWorkRemainingCount - recordsToAdd >= getMaxToGoBeyondOffset();
-        if (overMax) {
-            log.debug("Work remaining in partition queues has surpassed max, so won't bring further messages in from the pipeline queued: {} / max: {}",
-                    partitionWorkRemainingCount, getMaxToGoBeyondOffset());
-            return false;
-        }
-
-//        if (!inboundOffsetWidthWithinRange(records)) {
+//
+//    private int getMaxToGoBeyondOffset() {
+//        return backoffer.getCurrentTotalMaxCountBeyondOffset();
+//    }
+//
+//    /**
+//     * @return true if the records were accepted, false if they cannot be
+//     * @see #processInbox()
+//     */
+//    private boolean processInbox(ConsumerRecords<K, V> records) {
+//        int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
+//        int recordsToAdd = records.count();
+//        // we don't break up individual record sets (although we could, but "overhead") so need to queue up records even if it goes over by some amount
+//        boolean overMax = partitionWorkRemainingCount - recordsToAdd >= getMaxToGoBeyondOffset();
+//        if (overMax) {
+//            log.debug("Work remaining in partition queues has surpassed max, so won't bring further messages in from the pipeline queued: {} / max: {}",
+//                    partitionWorkRemainingCount, getMaxToGoBeyondOffset());
 //            return false;
 //        }
-
-        //
-        log.debug("Registering {} records of work ({} already registered)", recordsToAdd, partitionWorkRemainingCount);
-
-        for (ConsumerRecord<K, V> rec : records) {
-            processInbox(rec);
-        }
-
-        return true;
-    }
+//
+////        if (!inboundOffsetWidthWithinRange(records)) {
+////            return false;
+////        }
+//
+//        //
+//        log.debug("Registering {} records of work ({} already registered)", recordsToAdd, partitionWorkRemainingCount);
+//
+//        for (ConsumerRecord<K, V> rec : records) {
+//            processInbox(rec);
+//        }
+//
+//        return true;
+//    }
 
     private boolean inboundOffsetWidthWithinRange(final ConsumerRecords<K, V> records) {
         // brute force - surely very slow. surely this info can be cached?
@@ -410,7 +410,7 @@ private Object computeShardKey(ConsumerRecord<K, V> rec) {
     }
 
     public <R> List<WorkContainer<K, V>> maybeGetWork() {
-        return maybeGetWork(getMaxMessagesToQueue());
+        return maybeGetWork(Integer.MAX_VALUE);
     }
 
     /**
@@ -487,23 +487,18 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
 
         return work;
     }
-
-    private int getMaxMessagesToQueue() {
-        //return options.getNumberOfThreads() * options.getLoadingFactor();
-        double rate = successRatePer5Seconds.getRate();
-        int newRatae = (int) rate * 2;
-        int max = Math.max(newRatae, options.getNumberOfThreads() * 10);
-        log.debug("max to queue: {}", max);
-        return max;
-//        return options.getNumberOfThreads() * 10;
-    }
-
-    private final WindowedEventRate successRatePer5Seconds = new WindowedEventRate(5);
-    private final ExponentialMovingAverage successRatePer5SecondsEMA = new ExponentialMovingAverage(0.5);
+//
+//    private int getMaxMessagesToQueue() {
+//        //return options.getNumberOfThreads() * options.getLoadingFactor();
+//        double rate = successRatePer5Seconds.getRate();
+//        int newRatae = (int) rate * 2;
+//        int max = Math.max(newRatae, options.getNumberOfThreads() * 10);
+//        log.debug("max to queue: {}", max);
+//        return max;
+////        return options.getNumberOfThreads() * 10;
+//    }
 
     public void success(WorkContainer<K, V> wc) {
-        successRatePer5Seconds.newEvent();
-//        successRatePer5SecondsEMA.
         workStateIsDirtyNeedsCommitting.set(true);
         ConsumerRecord<K, V> cr = wc.getCr();
         log.trace("Work success ({}), removing from processing shard queue", wc);
@@ -695,7 +690,7 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
                     offsetsToSend.put(topicPartitionKey, offsetWithExtraMap);
                 } catch (EncodingNotSupportedException e) {
                     log.warn("No encodings could be used to encode the offset map, skipping. Warning: messages might be replayed on rebalance", e);
-                    backoffer.onFailure();
+//                    backoffer.onFailure();
                 }
             }
 
@@ -742,10 +737,10 @@ private void maybeStripOffsetPayload(Map<TopicPartition, OffsetAndMetadata> offs
                 OffsetAndMetadata stripped = new OffsetAndMetadata(v.offset()); // meta data gone
                 offsetsToSend.replace(key, stripped);
             }
-            backoffer.onFailure();
+//            backoffer.onFailure();
         } else if (totalOffsetMetaCharacterLength != 0) {
             log.debug("Offset map small enough to fit in payload: {} (max: {})", totalOffsetMetaCharacterLength, OffsetMapCodecManager.DefaultMaxMetadataSize);
-            backoffer.onSuccess();
+//            backoffer.onSuccess();
         }
     }
 
@@ -777,16 +772,17 @@ public boolean shouldThrottle() {
      *         should be downloaded (or pipelined in the Consumer)
      */
     boolean isSufficientlyLoaded() {
-        int total = getTotalWorkWaitingProcessing();
-        int inPartitions = getNumberOfEntriesInPartitionQueues();
-        int maxBeyondOffset = getMaxToGoBeyondOffset();
-        boolean loadedEnoughInPipeline = total > maxBeyondOffset * loadingFactor;
-        boolean overMaxUncommitted = inPartitions >= maxBeyondOffset;
-        boolean remainingIsSufficient = loadedEnoughInPipeline || overMaxUncommitted;
-//        if (remainingIsSufficient) {
-        log.debug("isSufficientlyLoaded? loadedEnoughInPipeline {} || overMaxUncommitted {}", loadedEnoughInPipeline, overMaxUncommitted);
-//        }
-        return remainingIsSufficient;
+//        int total = getTotalWorkWaitingProcessing();
+//        int inPartitions = getNumberOfEntriesInPartitionQueues();
+//        int maxBeyondOffset = getMaxToGoBeyondOffset();
+//        boolean loadedEnoughInPipeline = total > maxBeyondOffset * loadingFactor;
+//        boolean overMaxUncommitted = inPartitions >= maxBeyondOffset;
+//        boolean remainingIsSufficient = loadedEnoughInPipeline || overMaxUncommitted;
+////        if (remainingIsSufficient) {
+//        log.debug("isSufficientlyLoaded? loadedEnoughInPipeline {} || overMaxUncommitted {}", loadedEnoughInPipeline, overMaxUncommitted);
+////        }
+//        return remainingIsSufficient;
+        return !workInbox.isEmpty();
     }
 
     public int getRecordsOutForProcessing() {
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
index b4f94d598..e033190d3 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
@@ -141,19 +141,19 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 //                    } catch (InterruptedException e) {
 //                        e.printStackTrace();
 //                    }
-                    try {
-                        // 1/5 chance of taking a long time
-                        int chance = 10;
-                        int dice = RandomUtils.nextInt(0, chance);
-                        if (dice == 0) {
-                            Thread.sleep(100);
-                        } else {
-                            Thread.sleep(RandomUtils.nextInt(3, 20));
-                        }
-//                        Thread.sleep(5);
-                    } catch (InterruptedException e) {
-                        e.printStackTrace();
-                    }
+//                    try {
+//                        // 1/5 chance of taking a long time
+//                        int chance = 10;
+//                        int dice = RandomUtils.nextInt(0, chance);
+//                        if (dice == 0) {
+//                            Thread.sleep(100);
+//                        } else {
+//                            Thread.sleep(RandomUtils.nextInt(3, 20));
+//                        }
+////                        Thread.sleep(5);
+//                    } catch (InterruptedException e) {
+//                        e.printStackTrace();
+//                    }
                     bar.stepBy(1);
                     consumedKeys.add(record.key());
                     processedCount.incrementAndGet();
@@ -171,7 +171,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
             waitAtMost(ofSeconds(1200))
-                    .failFast(() -> pc.isClosedOrFailed(), () -> pc.getFailureCause()) // requires https://github.com/awaitility/awaitility/issues/178#issuecomment-734769761
+//                    .failFast(() -> pc.isClosedOrFailed(), () -> pc.getFailureCause()) // requires https://github.com/awaitility/awaitility/issues/178#issuecomment-734769761
                     .alias(failureMessage)
                     .pollInterval(1, SECONDS)
                     .untilAsserted(() -> {
diff --git a/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java b/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
index 3c31d2b7a..a8516d9cd 100644
--- a/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
+++ b/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
@@ -66,8 +66,6 @@ ParallelStreamProcessor<String, String> setupParallelConsumer() {
 
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(KEY) // <2>
-//                .maxMessagesToQueue(1000) // <3>
-//                .softMaxNumberMessagesBeyondBaseCommitOffset(1000) // <4>
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
diff --git a/pom.xml b/pom.xml
index 551bd47e5..6080e16d1 100644
--- a/pom.xml
+++ b/pom.xml
@@ -328,7 +328,7 @@
             <dependency>
                 <groupId>org.awaitility</groupId>
                 <artifactId>awaitility</artifactId>
-                <version>4.0.4-SNAPSHOT</version>
+                <version>4.0.3</version>
                 <scope>test</scope>
             </dependency>
             <dependency>

From 74476e3ddfad1478f163101f3916f6c1dbcf7ef6 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 7 Dec 2020 20:35:05 +0000
Subject: [PATCH 003/131] Dead code

---
 .../parallelconsumer/WorkManager.java         | 132 ------------------
 .../VeryLargeMessageVolumeTest.java           |   8 --
 .../parallelconsumer/BackPressureTests.java   |   2 -
 .../parallelconsumer/WorkManagerTest.java     |  14 --
 .../examples/streams/StreamsApp.java          |   2 -
 .../examples/vertx/VertxApp.java              |   2 -
 6 files changed, 160 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index e50e1e7c7..7f1f2a8cc 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -69,9 +69,6 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      * @see #findCompletedEligibleOffsetsAndRemove
      */
     private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new ConcurrentHashMap<>();
-    //    private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new HashMap<>();
-
-//    private final BackoffAnalyser backoffer;
 
     /**
      * Iteration resume point, to ensure fairness (prevent shard starvation) when we can't process messages from every
@@ -128,8 +125,6 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     public WorkManager(ParallelConsumerOptions options, org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
         this.options = options;
         this.consumer = consumer;
-
-//        backoffer = new BackoffAnalyser(options.getNumberOfThreads() * 10);
     }
 
     /**
@@ -246,14 +241,9 @@ private void processInbox(final int requestedMaxWorkToRetrieve) {
             }
         }
 
-        //
-//        int inFlight = getNumberOfEntriesInPartitionQueues();
-//        int max = getMaxToGoBeyondOffset();
-//        int gap = max - inFlight;
         int gap = requestedMaxWorkToRetrieve;
         int taken = 0;
 
-//        log.debug("Will register {} (max configured: {}) records of work ({} already registered)", gap, max, inFlight);
         log.debug("Will attempt to register {} - {} available", requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
 
         //
@@ -265,97 +255,6 @@ private void processInbox(final int requestedMaxWorkToRetrieve) {
 
         log.debug("{} new records were registered.", taken);
 
-//        ArrayList<ConsumerRecords<K, V>> toRemove = new ArrayList<>();
-//        for (final ConsumerRecords<K, V> records : internalBatchMailQueue) {
-//            records.
-//
-//        }
-//        boolean moreRecordsCanBeAccepted = processInbox(records);
-//        if (moreRecordsCanBeAccepted)
-//            toRemove.add(records);
-//        internalBatchMailQueue.removeAll(toRemove);
-    }
-//
-//    private int getMaxToGoBeyondOffset() {
-//        return backoffer.getCurrentTotalMaxCountBeyondOffset();
-//    }
-//
-//    /**
-//     * @return true if the records were accepted, false if they cannot be
-//     * @see #processInbox()
-//     */
-//    private boolean processInbox(ConsumerRecords<K, V> records) {
-//        int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
-//        int recordsToAdd = records.count();
-//        // we don't break up individual record sets (although we could, but "overhead") so need to queue up records even if it goes over by some amount
-//        boolean overMax = partitionWorkRemainingCount - recordsToAdd >= getMaxToGoBeyondOffset();
-//        if (overMax) {
-//            log.debug("Work remaining in partition queues has surpassed max, so won't bring further messages in from the pipeline queued: {} / max: {}",
-//                    partitionWorkRemainingCount, getMaxToGoBeyondOffset());
-//            return false;
-//        }
-//
-////        if (!inboundOffsetWidthWithinRange(records)) {
-////            return false;
-////        }
-//
-//        //
-//        log.debug("Registering {} records of work ({} already registered)", recordsToAdd, partitionWorkRemainingCount);
-//
-//        for (ConsumerRecord<K, V> rec : records) {
-//            processInbox(rec);
-//        }
-//
-//        return true;
-//    }
-
-    private boolean inboundOffsetWidthWithinRange(final ConsumerRecords<K, V> records) {
-        // brute force - surely very slow. surely this info can be cached?
-        Map<TopicPartition, List<ConsumerRecord<K, V>>> inbound = new HashMap<>();
-        for (final ConsumerRecord<K, V> record : records) {
-            TopicPartition tp = new TopicPartition(record.topic(), record.partition());
-            inbound.computeIfAbsent(tp, (ignore) -> new ArrayList<>()).add(record);
-        }
-
-        Set<Map.Entry<TopicPartition, List<ConsumerRecord<K, V>>>> inboundPartitionQueues = inbound.entrySet();
-        for (final Map.Entry<TopicPartition, List<ConsumerRecord<K, V>>> inboundPartitionQueue : inboundPartitionQueues) {
-            // get highest start offset
-            long start = 0l;
-            TopicPartition tp = inboundPartitionQueue.getKey();
-            NavigableMap<Long, WorkContainer<K, V>> longWorkContainerNavigableMap = partitionCommitQueues.get(tp);
-            if (longWorkContainerNavigableMap != null) {
-                for (final Map.Entry<Long, WorkContainer<K, V>> longWorkContainerEntry : longWorkContainerNavigableMap.entrySet()) {
-                    WorkContainer<K, V> value = longWorkContainerEntry.getValue();
-                    boolean userFunctionSucceeded = value.isUserFunctionSucceeded();
-                    if (!userFunctionSucceeded) {
-                        start = value.getCr().offset();
-
-                        // now find any record what would make the width too big. Binary search?
-                        // brute force
-                        List<ConsumerRecord<K, V>> inboundRecordQueue = inboundPartitionQueue.getValue();
-//                        ConsumerRecord<K, V> highestOffsetInboundRecord = inboundRecordQueue.get(inboundRecordQueue.size() - 1);
-//                        long newEnd = highestOffsetInboundRecord.offset();
-
-                        for (final ConsumerRecord<K, V> inboundRecord : inboundRecordQueue) {
-                            long newEnd = inboundRecord.offset();
-                            long width = newEnd - start;
-
-                            if (width >= BitsetEncoder.MAX_LENGTH_ENCODABLE) {
-                                long oldWidth = partitionOffsetHighWaterMarks.get(tp) - start;
-                                // can't be more accurate unless we break up the inbound records and count them per queue
-                                log.debug("Incoming outstanding offset difference too large for BitSet encoder (incoming width: {}, old width: {}), will wait before adding these records until the width shrinks (below {})",
-                                        width, oldWidth, BitsetEncoder.MAX_LENGTH_ENCODABLE);
-                                return false;
-//                                break;
-                            } else {
-                                log.debug("Width was ok {}", width);
-                            }
-                        }
-                    }
-                }
-            }
-        }
-        return true;
     }
 
     private void processInbox(final ConsumerRecord<K, V> rec) {
@@ -417,9 +316,6 @@ public <R> List<WorkContainer<K, V>> maybeGetWork() {
      * Depth first work retrieval.
      */
     public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
-        //int minWorkToGetSetting = min(min(requestedMaxWorkToRetrieve, getMaxMessagesToQueue()), getMaxToGoBeyondOffset());
-//        int minWorkToGetSetting = min(requestedMaxWorkToRetrieve, getMaxToGoBeyondOffset());
-//        int workToGetDelta = requestedMaxWorkToRetrieve - getRecordsOutForProcessing();
         int workToGetDelta = requestedMaxWorkToRetrieve;
 
         // optimise early
@@ -487,16 +383,6 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
 
         return work;
     }
-//
-//    private int getMaxMessagesToQueue() {
-//        //return options.getNumberOfThreads() * options.getLoadingFactor();
-//        double rate = successRatePer5Seconds.getRate();
-//        int newRatae = (int) rate * 2;
-//        int max = Math.max(newRatae, options.getNumberOfThreads() * 10);
-//        log.debug("max to queue: {}", max);
-//        return max;
-////        return options.getNumberOfThreads() * 10;
-//    }
 
     public void success(WorkContainer<K, V> wc) {
         workStateIsDirtyNeedsCommitting.set(true);
@@ -559,7 +445,6 @@ Integer getWorkQueuedInMailboxCount() {
         for (final ConsumerRecords<K, V> inboxEntry : workInbox) {
             batchCount += inboxEntry.count();
         }
-//        for (final ConsumerRecords<K, V> consumerRecords : Collections.unmodifiableCollection(internalBatchMailQueue)) { // copy for concurrent access - as it holds batches of polled records, it should be relatively small
         if (internalBatchMailQueue.size() > 10) {
             log.warn("Larger than expected {}", internalBatchMailQueue.size());
         }
@@ -568,9 +453,6 @@ Integer getWorkQueuedInMailboxCount() {
                 batchCount += consumerRecords.count();
             }
         }
-//        Integer batchCount = internalBatchMailQueue.stream()
-//                .map(ConsumerRecords::count)
-//                .reduce(0, Integer::sum);
         return batchCount + internalFlattenedMailQueue.size();
     }
 
@@ -587,7 +469,6 @@ public int getWorkQueuedInShardsCount() {
 
     boolean isRecordsAwaitingProcessing() {
         int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
-        //return partitionWorkRemainingCount > 0 || !workInbox.isEmpty() || !internalMailQueue.isEmpty();
         return partitionWorkRemainingCount > 0 || !internalBatchMailQueue.isEmpty() || !internalFlattenedMailQueue.isEmpty();
     }
 
@@ -690,7 +571,6 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
                     offsetsToSend.put(topicPartitionKey, offsetWithExtraMap);
                 } catch (EncodingNotSupportedException e) {
                     log.warn("No encodings could be used to encode the offset map, skipping. Warning: messages might be replayed on rebalance", e);
-//                    backoffer.onFailure();
                 }
             }
 
@@ -737,10 +617,8 @@ private void maybeStripOffsetPayload(Map<TopicPartition, OffsetAndMetadata> offs
                 OffsetAndMetadata stripped = new OffsetAndMetadata(v.offset()); // meta data gone
                 offsetsToSend.replace(key, stripped);
             }
-//            backoffer.onFailure();
         } else if (totalOffsetMetaCharacterLength != 0) {
             log.debug("Offset map small enough to fit in payload: {} (max: {})", totalOffsetMetaCharacterLength, OffsetMapCodecManager.DefaultMaxMetadataSize);
-//            backoffer.onSuccess();
         }
     }
 
@@ -772,16 +650,6 @@ public boolean shouldThrottle() {
      *         should be downloaded (or pipelined in the Consumer)
      */
     boolean isSufficientlyLoaded() {
-//        int total = getTotalWorkWaitingProcessing();
-//        int inPartitions = getNumberOfEntriesInPartitionQueues();
-//        int maxBeyondOffset = getMaxToGoBeyondOffset();
-//        boolean loadedEnoughInPipeline = total > maxBeyondOffset * loadingFactor;
-//        boolean overMaxUncommitted = inPartitions >= maxBeyondOffset;
-//        boolean remainingIsSufficient = loadedEnoughInPipeline || overMaxUncommitted;
-////        if (remainingIsSufficient) {
-//        log.debug("isSufficientlyLoaded? loadedEnoughInPipeline {} || overMaxUncommitted {}", loadedEnoughInPipeline, overMaxUncommitted);
-////        }
-//        return remainingIsSufficient;
         return !workInbox.isEmpty();
     }
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
index e033190d3..0fb0f3446 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
@@ -119,10 +119,6 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                 .commitMode(commitMode)
 //                .numberOfThreads(1)
                 .numberOfThreads(1000)
-//                .softMaxNumberMessagesBeyondBaseCommitOffset(100_000)
-//                .softMaxNumberMessagesBeyondBaseCommitOffset(10_000)
-//                .maxMessagesToQueue(10_000)
-//                .maxMessagesToQueue(6_000)
                 .build());
         pc.subscribe(of(inputName));
 
@@ -150,10 +146,6 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 //                        } else {
 //                            Thread.sleep(RandomUtils.nextInt(3, 20));
 //                        }
-////                        Thread.sleep(5);
-//                    } catch (InterruptedException e) {
-//                        e.printStackTrace();
-//                    }
                     bar.stepBy(1);
                     consumedKeys.add(record.key());
                     processedCount.incrementAndGet();
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
index 8961877bf..4097bb942 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
@@ -30,8 +30,6 @@ void backPressureShouldPreventTooManyMessagesBeingQueuedForProcessing() {
         int maxInFlight = 200;
         int maxQueue = 100;
         ParallelConsumerOptions<String, String> build = ParallelConsumerOptions.<String, String>builder()
-//                .softMaxNumberMessagesBeyondBaseCommitOffset(maxInFlight)
-//                .maxMessagesToQueue(maxQueue)
                 .build();
         WorkManager<String, String> wm = new WorkManager<>(build, consumerSpy);
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
index 6ab3b3102..bc3b0838b 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
@@ -31,7 +31,6 @@
 import static io.confluent.parallelconsumer.WorkContainer.getRetryDelay;
 import static java.time.Duration.ofSeconds;
 import static org.assertj.core.api.Assertions.assertThat;
-import static org.assertj.core.api.Assertions.fail;
 import static pl.tlinkowski.unij.api.UniLists.of;
 
 /**
@@ -282,10 +281,6 @@ public void insertWrongOrderPreservesOffsetOrdering() {
 
         int max = 10;
 
-//        //
-//        var works = wm.getWork(max);
-//        assertWork(works, of(0));
-
         var works = wm.maybeGetWork(4);
         assertOffsets(works, of(0, 1, 2, 6));
 
@@ -319,7 +314,6 @@ public void maxPerTopic() {
     public void maxInFlight() {
         //
         var opts = ParallelConsumerOptions.builder();
-//        opts.softMaxNumberMessagesBeyondBaseCommitOffset(1);
         setupWorkManager(opts.build());
 
         //
@@ -334,7 +328,6 @@ public void maxInFlight() {
     public void maxConcurrency() {
         //
         var opts = ParallelConsumerOptions.builder();
-//        opts.maxMessagesToQueue(1);
         setupWorkManager(opts.build());
 
         //
@@ -373,9 +366,6 @@ public void maxConcurrencyVsInFlightAndNoLeaks() {
         var opts = ParallelConsumerOptions.builder();
         opts.ordering(UNORDERED);
 
-//        opts.softMaxNumberMessagesBeyondBaseCommitOffset(3);
-//        opts.maxMessagesToQueue(2);
-
         setupWorkManager(opts.build());
 
         //
@@ -555,8 +545,6 @@ public void unorderedPartitionsGreedy() {
     @ParameterizedTest
     @ValueSource(ints = {1, 2, 5, 10, 20, 30, 50, 1000})
     public void highVolumeKeyOrder(int quantity) {
-//    public void highVolumeKeyOrder() {
-//        int quantity = 20000;
         int uniqueKeys = 100;
 
         ParallelConsumerOptions build = ParallelConsumerOptions.builder().ordering(KEY).build();
@@ -610,8 +598,6 @@ public void treeMapOrderingCorrect() {
     public void workQueuesEmptyWhenAllWorkComplete() {
         ParallelConsumerOptions build = ParallelConsumerOptions.builder()
                 .ordering(UNORDERED)
-//                .maxMessagesToQueue(10)
-//                .softMaxNumberMessagesBeyondBaseCommitOffset(10)
                 .build();
         setupWorkManager(build);
         registerSomeWork();
diff --git a/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java b/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java
index 39af4306d..669de9d0a 100644
--- a/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java
+++ b/parallel-consumer-examples/parallel-consumer-example-streams/src/main/java/io/confluent/parallelconsumer/examples/streams/StreamsApp.java
@@ -82,8 +82,6 @@ private void setupParallelConsumer() {
         Producer<String, String> kafkaProducer = getKafkaProducer();
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(ParallelConsumerOptions.ProcessingOrder.KEY)
-//                .maxMessagesToQueue(1000)
-//                .softMaxNumberMessagesBeyondBaseCommitOffset(10000)
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
diff --git a/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java b/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java
index ae4bc6140..9f7d163d9 100644
--- a/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java
+++ b/parallel-consumer-examples/parallel-consumer-example-vertx/src/main/java/io/confluent/parallelconsumer/examples/vertx/VertxApp.java
@@ -41,8 +41,6 @@ void run() {
         Producer<String, String> kafkaProducer = getKafkaProducer();
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(ParallelConsumerOptions.ProcessingOrder.KEY)
-//                .maxMessagesToQueue(1000)
-//                .softMaxNumberMessagesBeyondBaseCommitOffset(10000)
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();

From 6509b6648e46f90bff9c6263faec1a6202fa2d16 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 7 Dec 2020 20:47:05 +0000
Subject: [PATCH 004/131] Dead code

---
 .../ParallelEoSStreamProcessor.java           | 56 +------------------
 1 file changed, 2 insertions(+), 54 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 2063dfe62..9bc257010 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -44,8 +44,6 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
 
     private final ParallelConsumerOptions options;
 
-//    private final BackoffAnalyser backoffer;
-
     /**
      * Injectable clock for testing
      */
@@ -177,23 +175,7 @@ public ParallelEoSStreamProcessor(ParallelConsumerOptions newOptions) {
         LinkedBlockingQueue<Runnable> poolQueue = new LinkedBlockingQueue<>();
         workerPool = new ThreadPoolExecutor(newOptions.getNumberOfThreads(), newOptions.getNumberOfThreads(),
                 0L, MILLISECONDS,
-                poolQueue)
-        ;
-//        {
-//            @Override
-//            protected void beforeExecute(final Thread t, final Runnable r) {
-//                super.beforeExecute(t, r);
-//                if (dynamicExtraLoadFactor.couldStep() && getQueue().isEmpty() && wm.isNotPartitionedOrDrained()) {
-//                    boolean increased = dynamicExtraLoadFactor.maybeIncrease();
-//                    if (increased) {
-//                        log.warn("No work to do! Increased dynamic load factor to {}", dynamicExtraLoadFactor.getCurrent());
-//                    }
-//                }
-////                if (getQueue().size() < 100 && wm.isNotPartitionedOrDrained()) {
-////                    log.warn("Less than 100 tasks left!");
-////                }
-//            }
-//        };
+                poolQueue);
 
         this.wm = new WorkManager<>(newOptions, consumer);
 
@@ -648,11 +630,10 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
         brokerPollSubsystem.supervise();
 
         Duration duration = Duration.ofMillis(1);
-//        log.debug("Thread yield {}", duration);
         try {
             Thread.sleep(duration.toMillis());
         } catch (InterruptedException e) {
-            log.debug("Woke up", e);
+            log.trace("Woke up", e);
         }
 
         // end of loop
@@ -677,8 +658,6 @@ private <R> void handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFu
             submitWorkToPool(userFunction, callback, records);
         }
 
-//        log.debug("Pool stats: {}", workerPool);
-
         if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
             boolean steppedUp = dynamicExtraLoadFactor.maybeStepUp();
             if (steppedUp) {
@@ -694,18 +673,12 @@ private <R> void handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFu
             log.info("Stats: \n- pool active: {} queued:{} \n- queue size: {} target: {} loading factor: {}",
                     workerPool.getActiveCount(), queueSize, queueSize, getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrent());
         });
-//        else if (dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
-//            log.warn("Executor pool queue is OK! {} vs {}",
-//                    workerPool.getQueue().size(), getPoolQueueTarget());
-//        }
     }
 
     /**
      * @return aim to never have the pool queue drop below this
      */
     private int getPoolQueueTarget() {
-//        int loadingFactor = options.getLoadingFactor();
-//        return options.getNumberOfThreads() * loadingFactor;
         return options.getNumberOfThreads();
     }
 
@@ -772,18 +745,6 @@ private void processWorkCompleteMailBox() {
         int size = workMailBox.size();
         log.trace("Draining {} more, got {} already...", size, results.size());
         workMailBox.drainTo(results, size);
-//        for (var ignore : range(size)) {
-//            // #drainTo is nondeterministic during concurrent access - poll is more deterministic and we limit our loops to ensure progress, at the cost of some performance
-//            WorkContainer<K, V> secondPollNonBlocking = null; // if we poll too many, don't block
-//            try {
-//                secondPollNonBlocking = workMailBox.poll(0, SECONDS);
-//            } catch (InterruptedException e) {
-//                log.debug("Interrupted waiting on work results", e);
-//            }
-//            if (secondPollNonBlocking != null) {
-//                results.add(secondPollNonBlocking);
-//            }
-//        }
 
         log.trace("Processing drained work {}...", results.size());
         for (var work : results) {
@@ -934,21 +895,8 @@ protected <R> List<Tuple<ConsumerRecord<K, V>, R>> userFunctionRunner(Function<C
             addToMailbox(wc); // always add on error
             throw e; // trow again to make the future failed
         }
-//        finally {
-//            onWorkFunctionFinish();
-//        }
     }
 
-//    private void onWorkFunctionFinish() {
-//        checkEnoughWorkIsQueued()
-//    }
-//
-//    private void checkEnoughWorkIsQueued() {
-//        if (isPoolQueueLow()) {
-//            notifyNewWorkRegistered();
-//        }
-//    }
-
     protected void addToMailBoxOnUserFunctionSuccess(WorkContainer<K, V> wc, List<?> resultsFromUserFunction) {
         addToMailbox(wc);
     }

From 1c490c3dea39f488bb052e9f51482e1f15266ded Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 8 Dec 2020 14:27:31 +0000
Subject: [PATCH 005/131] Fix tests

---
 .../ParallelConsumerOptions.java              |  2 +-
 .../parallelconsumer/BackPressureTests.java   | 82 ----------------
 .../parallelconsumer/OffsetEncodingTests.java |  4 +-
 .../ParallelEoSStreamProcessorTestBase.java   |  7 +-
 .../parallelconsumer/WorkManagerTest.java     | 98 ++-----------------
 5 files changed, 16 insertions(+), 177 deletions(-)
 delete mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
index b171d5c49..dff470b7f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
@@ -91,7 +91,7 @@ public enum CommitMode {
      * The order type to use
      */
     @Builder.Default
-    private final ProcessingOrder ordering = ProcessingOrder.UNORDERED;
+    private final ProcessingOrder ordering = ProcessingOrder.KEY;
 
     @Builder.Default
     private final CommitMode commitMode = CommitMode.CONSUMER_ASYNCHRONOUS;
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
deleted file mode 100644
index 4097bb942..000000000
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
+++ /dev/null
@@ -1,82 +0,0 @@
-package io.confluent.parallelconsumer;
-
-import io.confluent.csid.utils.KafkaTestUtils;
-import org.apache.kafka.clients.consumer.ConsumerRecord;
-import org.apache.kafka.clients.consumer.ConsumerRecords;
-import org.apache.kafka.common.TopicPartition;
-import org.junit.jupiter.api.Test;
-
-import java.util.Collections;
-import java.util.Comparator;
-import java.util.HashMap;
-import java.util.List;
-
-import static org.assertj.core.api.Assertions.assertThat;
-
-public class BackPressureTests extends ParallelEoSStreamProcessorTestBase {
-
-    /**
-     * Tests that the backpressure system works correctly
-     * - that when max queued messages are reached, more aren't queued up
-     * - that more records aren't added for processing than are desired via settings.
-     */
-    @Test
-    void backPressureShouldPreventTooManyMessagesBeingQueuedForProcessing() {
-        // mock messages downloaded for processing > MAX_TO_QUEUE
-        // make sure work manager doesn't queue more than MAX_TO_QUEUE
-        final int numRecords = 1_000;
-
-        //
-        int maxInFlight = 200;
-        int maxQueue = 100;
-        ParallelConsumerOptions<String, String> build = ParallelConsumerOptions.<String, String>builder()
-                .build();
-        WorkManager<String, String> wm = new WorkManager<>(build, consumerSpy);
-
-        // add records
-        {
-            ConsumerRecords<String, String> crs = buildConsumerRecords(numRecords);
-            wm.registerWork(crs);
-        }
-
-        //
-        {
-            List<WorkContainer<String, String>> work = wm.maybeGetWork();
-            assertThat(work).hasSize(maxQueue);
-            assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(maxInFlight);
-
-            KafkaTestUtils.completeWork(wm, work, 50);
-            KafkaTestUtils.completeWork(wm, work, 55);
-        }
-
-        // add more records
-        {
-            assertThat(wm.shouldThrottle()).isTrue();
-            assertThat(wm.isSufficientlyLoaded()).isTrue();
-            ConsumerRecords<String, String> crs = buildConsumerRecords(numRecords);
-            wm.registerWork(crs);
-            assertThat(wm.getNumberOfEntriesInPartitionQueues()).as("Hasn't increased").isEqualTo(maxInFlight);
-        }
-
-        // get more work
-        {
-            List<WorkContainer<String, String>> workContainers = wm.maybeGetWork();
-            assertThat(workContainers).hasSize(2);
-            assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(maxInFlight);
-            assertThat(wm.shouldThrottle()).isTrue();
-            assertThat(wm.isSufficientlyLoaded()).isTrue();
-        }
-
-    }
-
-    private ConsumerRecords<String, String> buildConsumerRecords(final int numRecords) {
-        List<ConsumerRecord<String, String>> consumerRecords = ktu.generateRecords(numRecords);
-        Collections.sort(consumerRecords, Comparator.comparingLong(ConsumerRecord::offset));
-        HashMap<TopicPartition, List<ConsumerRecord<String, String>>> recordsMap = new HashMap<>();
-        TopicPartition tp = new TopicPartition(INPUT_TOPIC, 0);
-        recordsMap.put(tp, consumerRecords);
-        ConsumerRecords<String, String> crs = new ConsumerRecords<>(recordsMap);
-        return crs;
-    }
-
-}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
index 8c7990153..0ff25a84d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
@@ -62,7 +62,8 @@ void runLengthDeserialise() {
     @ValueSource(longs = {
             10_000L,
             100_000L,
-            100_000_000L, // slow
+            100_000_0L,
+//            100_000_000L, // very~ slow
     })
     void largeIncompleteOffsetValues(long nextExpectedOffset) {
         var incompletes = new HashSet<Long>();
@@ -153,6 +154,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
             wmm.registerWork(crs);
 
             List<WorkContainer<String, String>> work = wmm.maybeGetWork();
+            assertThat(work).hasSameSizeAs(records);
 
             KafkaTestUtils.completeWork(wmm, work, 0);
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java
index e4bd520ea..7b8973876 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java
@@ -26,6 +26,7 @@
 import static io.confluent.csid.utils.Range.range;
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.*;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.time.Duration.ofMillis;
 import static java.time.Duration.ofSeconds;
 import static java.util.concurrent.TimeUnit.SECONDS;
@@ -92,7 +93,11 @@ public class ParallelEoSStreamProcessorTestBase {
 
     @BeforeEach
     public void setupAsyncConsumerTestBase() {
-        setupParallelConsumerInstance(ParallelConsumerOptions.builder().commitMode(CONSUMER_SYNC).build());
+        ParallelConsumerOptions<Object, Object> options = ParallelConsumerOptions.builder()
+                .commitMode(CONSUMER_SYNC)
+                .ordering(UNORDERED)
+                .build();
+        setupParallelConsumerInstance(options);
     }
 
     protected List<WorkContainer<String, String>> successfulWork = Collections.synchronizedList(new ArrayList<>());
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
index bc3b0838b..69e7609bc 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
@@ -73,6 +73,9 @@ private void setupWorkManager(ParallelConsumerOptions build) {
         });
     }
 
+    /**
+     * Adds 3 units of work
+     */
     private void registerSomeWork() {
         String key = "key-0";
         int partition = 0;
@@ -143,13 +146,13 @@ public void testUnorderedAndDelayed() {
         assertOffsets(works, of(1));
         wm.success(works.get(0));
 
-        Assertions.assertThat(successfulWork)
+        assertThat(successfulWork)
                 .extracting(x -> (int) x.getCr().offset())
                 .isEqualTo(of(0, 2, 1));
     }
 
     private AbstractListAssert<?, List<? extends Integer>, Integer, ObjectAssert<Integer>> assertOffsets(List<WorkContainer<String, String>> works, List<Integer> expected) {
-        return Assertions.assertThat(works)
+        return assertThat(works)
                 .extracting(x -> (int) x.getCr().offset())
                 .isEqualTo(expected);
     }
@@ -324,20 +327,6 @@ public void maxInFlight() {
         assertThat(wm.maybeGetWork()).isEmpty();
     }
 
-    @Test
-    public void maxConcurrency() {
-        //
-        var opts = ParallelConsumerOptions.builder();
-        setupWorkManager(opts.build());
-
-        //
-        registerSomeWork();
-
-        //
-        assertThat(wm.maybeGetWork()).hasSize(1);
-        assertThat(wm.maybeGetWork()).isEmpty();
-    }
-
     static class FluentQueue<T> implements Iterable<T> {
         ArrayDeque<T> work = new ArrayDeque<>();
 
@@ -360,81 +349,6 @@ public int size() {
         }
     }
 
-    @Test
-    public void maxConcurrencyVsInFlightAndNoLeaks() {
-        //
-        var opts = ParallelConsumerOptions.builder();
-        opts.ordering(UNORDERED);
-
-        setupWorkManager(opts.build());
-
-        //
-        registerSomeWork();
-        registerSomeWork();
-        registerSomeWork();
-
-        //
-        assertThat(wm.getTotalWorkWaitingProcessing()).isEqualTo(9);
-
-        //
-        var work = new FluentQueue<WorkContainer<String, String>>();
-        Assertions.assertThat(work.add(wm.maybeGetWork())).hasSize(2);
-
-        //
-        assertThat(wm.maybeGetWork()).isEmpty();
-
-        // succeed
-        wm.success(work.poll());
-
-        //
-        Assertions.assertThat(work.add(wm.maybeGetWork())).hasSize(1);
-
-        //
-        wm.failed(work.poll());
-        // bump the clock - we're not testing delayed failure
-        advanceClockByDelay();
-
-        //
-        Assertions.assertThat(work.add(wm.maybeGetWork())).hasSize(1);
-
-        //
-        wm.success(work.poll());
-        wm.success(work.poll());
-
-        //
-        Assertions.assertThat(work.add(wm.maybeGetWork(100))).hasSize(2);
-
-        //
-        for (var ignore : work) {
-            wm.success(work.poll());
-        }
-
-        //
-        Assertions.assertThat(work.add(wm.maybeGetWork(10))).hasSize(2);
-
-        //
-        assertThat(wm.getRecordsOutForProcessing()).isEqualTo(2);
-        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(9);
-        assertThat(wm.getWorkQueuedInShardsCount()).isEqualTo(4);
-        Assertions.assertThat(successfulWork).hasSize(5);
-
-        //
-        wm.success(work.poll());
-        wm.success(work.poll());
-
-        //
-        Assertions.assertThat(work.add(wm.maybeGetWork(10))).hasSize(2);
-        wm.success(work.poll());
-        wm.success(work.poll());
-
-        //
-        assertThat(work.size()).isEqualTo(0);
-        Assertions.assertThat(successfulWork).hasSize(9);
-        assertThat(wm.getRecordsOutForProcessing()).isEqualTo(0);
-        assertThat(wm.getWorkQueuedInShardsCount()).isEqualTo(0);
-        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(9);
-    }
-
     @Test
     @Disabled
     public void multipleFailures() {
@@ -569,7 +483,7 @@ public void highVolumeKeyOrder(int quantity) {
         List<WorkContainer<String, String>> work = wm.maybeGetWork();
 
         //
-        Assertions.assertThat(work).hasSameSizeAs(records.keySet());
+        assertThat(work).hasSameSizeAs(records.keySet());
     }
 
     @Test

From 78b9baddd07fa0b9ad555e01793fd3a508eba9d0 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 9 Dec 2020 11:24:01 +0000
Subject: [PATCH 006/131] More

---
 .../io/confluent/parallelconsumer/DynamicLoadFactor.java   | 5 +++++
 .../parallelconsumer/ParallelEoSStreamProcessor.java       | 4 +++-
 .../io/confluent/parallelconsumer/ProducerManager.java     | 2 +-
 .../integrationTests/TransactionAndCommitModeTest.java     | 7 +++++++
 parallel-consumer-core/src/test/resources/logback-test.xml | 2 +-
 5 files changed, 17 insertions(+), 3 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
index 15b987883..957e58439 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
@@ -29,6 +29,11 @@ public class DynamicLoadFactor {
     @Getter
     int current = DEFAULT_INITIAL_LOADING_FACTOR;
 
+    /**
+     * Try to increase the loading factor
+     *
+     * @return true if could step up
+     */
     public boolean maybeStepUp() {
         long now = System.currentTimeMillis();
         if (couldStep()) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 9bc257010..6bf021755 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -658,7 +658,9 @@ private <R> void handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFu
             submitWorkToPool(userFunction, callback, records);
         }
 
-        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
+        boolean moreWorkInQueuesAvailableThatHasntBeenPulled = wm.getWorkQueuedInMailboxCount() > options.getNumberOfThreads();
+//        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
+        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver() && moreWorkInQueuesAvailableThatHasntBeenPulled) {
             boolean steppedUp = dynamicExtraLoadFactor.maybeStepUp();
             if (steppedUp) {
                 log.warn("Executor pool queue is not loaded with enough work (queue: {} vs target: {}), stepped up loading factor to {}",
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
index cab36250e..cf06d9063 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
@@ -200,7 +200,7 @@ protected void commitOffsets(final Map<TopicPartition, OffsetAndMetadata> offset
                         boolean ready = (lastErrorSavedForRethrow != null) ? !lastErrorSavedForRethrow.getMessage().contains("Invalid transition attempted from state READY to state COMMITTING_TRANSACTION") : true;
                         if (ready) {
                             // try again
-                            log.error("Was already ready - tx completed between interrupt and retry");
+                            log.error("Transaction was already in READY state - tx completed between interrupt and retry");
                         }
                     } else {
                         // happy path
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index 23f903a0a..c435a2fb0 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -34,8 +34,10 @@
 import java.util.stream.Collectors;
 import java.util.stream.IntStream;
 
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.CONSUMER_SYNC;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.TRANSACTIONAL_PRODUCER;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.time.Duration.ofSeconds;
 import static org.assertj.core.api.Assertions.*;
 import static org.awaitility.Awaitility.waitAtMost;
@@ -71,6 +73,11 @@ void testDefaultMaxPoll(CommitMode commitMode, ProcessingOrder order) {
         runTest(DEFAULT_MAX_POLL_RECORDS_CONFIG, commitMode, order);
     }
 
+    @Test
+    void testDefaultMaxPollSlow() {
+        runTest(DEFAULT_MAX_POLL_RECORDS_CONFIG, CONSUMER_SYNC, UNORDERED);
+    }
+
     static CartesianProductTest.Sets enumSets() {
         return new EnumCartesianProductTestSets()
                 .add(CommitMode.class)
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 0af549ed2..9fad2dd93 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -27,7 +27,7 @@
 
     <!-- primary -->
     <logger name="io.confluent.parallelconsumer" level="info"/>
-<!--    <logger name="io.confluent.parallelconsumer" level="debug"/>-->
+    <logger name="io.confluent.parallelconsumer" level="debug"/>
     <!--    <logger name="io.confluent.parallelconsumer" level="trace"/>-->
 <!--            <logger name="io.confluent.parallelconsumer.ParallelEoSStreamProcessor" level="debug"/>-->
 <!--        <logger name="io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest" level="info"/> &lt;!&ndash; docker logs &ndash;&gt;-->

From 448ce9e246b6bdba0cb06219774f2bb7e82cf009 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 9 Dec 2020 11:26:39 +0000
Subject: [PATCH 007/131] Install Progress tracker

---
 .../TransactionAndCommitModeTest.java         |  3 ++
 .../confluent/csid/utils/ProgressTracker.java | 46 +++++++++++++++++++
 2 files changed, 49 insertions(+)
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index c435a2fb0..2a10c5fec 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -5,6 +5,7 @@
  */
 
 import io.confluent.csid.utils.EnumCartesianProductTestSets;
+import io.confluent.csid.utils.ProgressTracker;
 import io.confluent.csid.utils.StringUtils;
 import io.confluent.csid.utils.TrimListRepresentation;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
@@ -168,11 +169,13 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
         // wait for all pre-produced messages to be processed and produced
         Assertions.useRepresentation(new TrimListRepresentation());
+        ProgressTracker pt = new ProgressTracker(processedCount);
         var failureMessage = StringUtils.msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
             waitAtMost(ofSeconds(20)).alias(failureMessage).untilAsserted(() -> {
                 log.info("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
+                pt.checkForProgress();
                 SoftAssertions all = new SoftAssertions();
                 all.assertThat(new ArrayList<>(consumedKeys)).as("all expected are consumed").hasSameSizeAs(expectedKeys);
                 all.assertThat(new ArrayList<>(producedKeysAcknowledged)).as("all consumed are produced ok ").hasSameSizeAs(expectedKeys);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
new file mode 100644
index 000000000..54fbb52a0
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
@@ -0,0 +1,46 @@
+package io.confluent.csid.utils;
+
+import io.confluent.parallelconsumer.InternalRuntimeError;
+import lombok.RequiredArgsConstructor;
+
+import java.util.concurrent.atomic.AtomicInteger;
+
+import static io.confluent.csid.utils.StringUtils.msg;
+
+@RequiredArgsConstructor
+public class ProgressTracker {
+
+    private final AtomicInteger processedCount;
+    private final AtomicInteger lastSeen = new AtomicInteger(0);
+    private final AtomicInteger rounds = new AtomicInteger(0);
+    private final int roundsAllowed = 3;
+    private final int coldRoundsAllowed = 20;
+
+    /**
+     * @return true if progress has been made, false if not
+     */
+    public boolean checkForProgress() {
+        boolean progress = processedCount.get() > lastSeen.get();
+        boolean warmedUp = processedCount.get() > 0;
+        boolean enoughAttempts = rounds.get() > roundsAllowed;
+        if (warmedUp && !progress && enoughAttempts) {
+            return true;
+        } else if (progress) {
+            rounds.set(0);
+        } else if (!warmedUp && rounds.get() > coldRoundsAllowed) {
+            return true;
+        }
+        lastSeen.set(processedCount.get());
+        rounds.incrementAndGet();
+        return false;
+    }
+
+    public void checkForProgressExceptionally() {
+        boolean progress = checkForProgress();
+        if (!progress) throw new InternalRuntimeError("No progress");
+    }
+
+    public Exception getError() {
+        return new InternalRuntimeError(msg("No progress beyond {} records after {} rounds", processedCount, rounds));
+    }
+}

From 2ed24cfec2973c93b7ce3da55929f64e54cd1603 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 9 Dec 2020 13:00:44 +0000
Subject: [PATCH 008/131] Queue pressure system fixes

More

More

More
---
 .../io/confluent/csid/utils/TimeUtils.java    |  23 +++
 .../parallelconsumer/BrokerPollSystem.java    |  42 ++++-
 .../parallelconsumer/ConsumerManager.java     |  14 +-
 .../ConsumerOffsetCommitter.java              |   3 +-
 .../parallelconsumer/DrainingCloseable.java   |   2 +-
 .../parallelconsumer/DynamicLoadFactor.java   |  48 +++--
 .../ParallelEoSStreamProcessor.java           | 170 +++++++++++++-----
 .../parallelconsumer/ProducerManager.java     |  13 +-
 .../parallelconsumer/RateLimiter.java         |  26 ++-
 .../parallelconsumer/WorkContainer.java       |   6 +
 .../parallelconsumer/WorkManager.java         |  79 +++++---
 .../TransactionAndCommitModeTest.java         |  28 ++-
 .../confluent/csid/utils/ProgressTracker.java |  32 ++--
 .../src/test/resources/logback-test.xml       |   4 +-
 14 files changed, 367 insertions(+), 123 deletions(-)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/csid/utils/TimeUtils.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/TimeUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/TimeUtils.java
new file mode 100644
index 000000000..761e48aa2
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/TimeUtils.java
@@ -0,0 +1,23 @@
+package io.confluent.csid.utils;
+
+import lombok.SneakyThrows;
+import lombok.experimental.UtilityClass;
+import lombok.extern.slf4j.Slf4j;
+
+import java.time.Duration;
+import java.util.concurrent.Callable;
+
+@Slf4j
+@UtilityClass
+public class TimeUtils {
+
+    @SneakyThrows
+    public static <RESULT> RESULT time(final Callable<RESULT> func) {
+        long start = System.currentTimeMillis();
+        RESULT call = func.call();
+        long elapsed = System.currentTimeMillis() - start;
+        log.trace("Function took {}", Duration.ofMillis(elapsed));
+        return call;
+
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
index cb8b4c162..7ea06d5c3 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
@@ -36,10 +36,11 @@ public class BrokerPollSystem<K, V> implements OffsetCommitter {
 
     private final ConsumerManager<K, V> consumerManager;
 
-    private ParallelEoSStreamProcessor.State state = ParallelEoSStreamProcessor.State.running;
+    private ParallelEoSStreamProcessor.State state = running;
 
     private Optional<Future<Boolean>> pollControlThreadFuture;
 
+    @Getter
     private volatile boolean paused = false;
 
     private final ParallelEoSStreamProcessor<K, V> pc;
@@ -103,6 +104,11 @@ private boolean controlLoop() {
                     if (!polledRecords.isEmpty()) {
                         log.trace("Loop: Register work");
                         wm.registerWork(polledRecords);
+
+                        // notify control work has been registered, in case it's sleeping waiting for work that will never come
+                        if (!wm.hasWorkInMailboxes()) {
+                            pc.notifyNewWorkRegistered();
+                        }
                     }
                 }
 
@@ -160,7 +166,8 @@ private ConsumerRecords<K, V> pollBrokerForRecords() {
         managePauseOfSubscription();
         log.debug("Subscriptions are paused: {}", paused);
 
-        Duration thisLongPollTimeout = (state == ParallelEoSStreamProcessor.State.running) ? BrokerPollSystem.longPollTimeout : Duration.ofMillis(1); // Can't use Duration.ZERO - this causes Object#wait to wait forever
+        Duration thisLongPollTimeout = state == running ? BrokerPollSystem.longPollTimeout
+                : Duration.ofMillis(1); // Can't use Duration.ZERO - this causes Object#wait to wait forever
 
         log.debug("Long polling broker with timeout {} seconds, might appear to sleep here if subs are paused, or no data available on broker.", toSeconds(thisLongPollTimeout)); // java 8
         return consumerManager.poll(thisLongPollTimeout);
@@ -178,15 +185,29 @@ public void drain() {
         }
     }
 
+    //    private final Duration maxPauseFlapRate = Duration.ofSeconds(1);
+    private final RateLimiter pauseLimiter = new RateLimiter(1);
+
     private void doPause() {
         // idempotent
         if (paused) {
             log.trace("Already paused");
         } else {
-            paused = true;
-            log.debug("Pausing subs");
-            Set<TopicPartition> assignment = consumerManager.assignment();
-            consumerManager.pause(assignment);
+            if (pauseLimiter.couldPerform()) {
+                pauseLimiter.performIfNotLimited(() -> {
+                    paused = true;
+                    log.debug("Pausing subs");
+                    Set<TopicPartition> assignment = consumerManager.assignment();
+                    consumerManager.pause(assignment);
+                });
+            } else {
+                if (log.isDebugEnabled()) {
+                    log.debug("Should pause but pause rate limit exceeded {} vs {}. Queued: {}",
+                            pauseLimiter.getElapsedDuration(),
+                            pauseLimiter.getRate(),
+                            wm.getWorkQueuedInMailboxCount());
+                }
+            }
         }
     }
 
@@ -226,7 +247,9 @@ private void transitionToClosing() {
      * make sure we maintain the keep alive with the broker so as not to cause a rebalance.
      */
     private void managePauseOfSubscription() {
-        if (shouldThrottle()) {
+        boolean throttle = shouldThrottle();
+        log.trace("Need to throttle: {}", throttle);
+        if (throttle) {
             doPause();
         } else {
             resumeIfPaused();
@@ -278,7 +301,8 @@ private void maybeDoCommit() {
     /**
      * Wakeup if colling the broker
      */
-    public void wakeup() {
-        consumerManager.wakeup();
+    public void wakeupIfPaused() {
+        if (paused)
+            consumerManager.wakeup();
     }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
index 6da6865aa..73db6d86b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
@@ -26,12 +26,19 @@ public class ConsumerManager<K, V> {
     private int erroneousWakups = 0;
     private int correctPollWakeups = 0;
     private int noWakeups = 0;
+    private boolean commitRequested;
 
-    ConsumerRecords<K, V> poll(Duration thisLongPollTimeout) {
+    ConsumerRecords<K, V> poll(Duration requestedLongPollTimeout) {
+        Duration timeoutToUse = requestedLongPollTimeout;
         ConsumerRecords<K, V> records;
         try {
+            if (commitRequested) {
+                log.warn("Commit requested, so will not long poll as need to perform the commit");
+                timeoutToUse = Duration.ofMillis(1);// disable long poll, as commit needs performing
+                commitRequested = false;
+            }
             pollingBroker.set(true);
-            records = consumer.poll(thisLongPollTimeout);
+            records = consumer.poll(timeoutToUse);
             log.debug("Poll completed normally and returned {}...", records.count());
         } catch (WakeupException w) {
             correctPollWakeups++;
@@ -112,4 +119,7 @@ public void resume(final Set<TopicPartition> pausedTopics) {
         consumer.resume(pausedTopics);
     }
 
+    public void onCommitRequested() {
+        this.commitRequested = true;
+    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java
index e6ac02236..61c747652 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java
@@ -153,7 +153,6 @@ private void commitAndWaitForCondition() {
             this.commitPerformed = commitLock.newCondition();
             long currentCount = commitCount.get();
             requestCommitInternal();
-            consumerMgr.wakeup();
             while (currentCount == commitCount.get()) {
                 if (currentCount == commitCount.get()) {
                     log.debug("Requesting commit again");
@@ -178,6 +177,7 @@ private void requestCommitInternal() {
         commitLock.lock();
         try {
             commitRequested.set(true);
+            consumerMgr.onCommitRequested();
             consumerMgr.wakeup();
         } finally {
             commitLock.unlock();
@@ -189,6 +189,7 @@ void maybeDoCommit() {
         commitLock.lock();
         try {
             if (commitRequested.get()) {
+                log.debug("Commit requested, performing...");
                 retrieveOffsetsAndCommit();
             }
         } finally {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DrainingCloseable.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DrainingCloseable.java
index c4c66f2fd..942516043 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DrainingCloseable.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DrainingCloseable.java
@@ -9,7 +9,7 @@
 
 public interface DrainingCloseable extends Closeable {
 
-    Duration DEFAULT_TIMEOUT = Duration.ofSeconds(10); // can increase if debugging
+    Duration DEFAULT_TIMEOUT = Duration.ofSeconds(30); // can increase if debugging
 
     enum DrainingMode {
         /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
index 957e58439..e8d427c59 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
@@ -1,9 +1,11 @@
 package io.confluent.parallelconsumer;
 
 import lombok.Getter;
+import lombok.extern.slf4j.Slf4j;
 
 import java.time.Duration;
 
+@Slf4j
 public class DynamicLoadFactor {
 
     /**
@@ -18,16 +20,24 @@ public class DynamicLoadFactor {
      */
     private static final int DEFAULT_INITIAL_LOADING_FACTOR = 2;
 
-    private final long start = System.currentTimeMillis();
-    private final Duration coolDown = Duration.ofSeconds(2);
-    private final Duration warmUp = Duration.ofSeconds(5); // CG usually takes 5 seconds to start running
-    private long lastStep = 0;
-    private final int step = 1;
+    private final long startTimeMs = System.currentTimeMillis();
+    private final Duration coolDown = Duration.ofSeconds(1);
+    private final Duration warmUp = Duration.ofSeconds(0); // CG usually takes 5 seconds to start running
+    private final int stepUpFactorBy = 2;
+
+    /**
+     * Upper safety cap on multiples of target queue size to reach (e.g. with 20 threads, this would be 20 * 100 =
+     * 20,000 messages _queued_.
+     * <p>
+     * Expectation is some relatively small multiple of the degree of concurrency, enough that each time a thread
+     * finishes, theres at least one more entry for it in the queue.
+     */
     @Getter
-    private final int max = 5;
+    private final int maxFactor = 100;
 
     @Getter
-    int current = DEFAULT_INITIAL_LOADING_FACTOR;
+    private int currentFactor = DEFAULT_INITIAL_LOADING_FACTOR;
+    private long lastSteppedFactor = currentFactor;
 
     /**
      * Try to increase the loading factor
@@ -35,19 +45,21 @@ public class DynamicLoadFactor {
      * @return true if could step up
      */
     public boolean maybeStepUp() {
-        long now = System.currentTimeMillis();
+        long nowMs = System.currentTimeMillis();
         if (couldStep()) {
-            return doStep(now, lastStep);
+            return doStep(nowMs, lastSteppedFactor);
         }
         return false;
     }
 
-    private synchronized boolean doStep(final long now, final long myLastStep) {
-        if (current < max) {
+    private synchronized boolean doStep(final long nowMs, final long myLastStep) {
+        if (currentFactor < maxFactor) {
             // compare and set
-            if (myLastStep == lastStep) {
-                current = current + step;
-                lastStep = now;
+            if (myLastStep == lastSteppedFactor) {
+                currentFactor = currentFactor + stepUpFactorBy;
+                long delta = currentFactor - myLastStep;
+                log.debug("Stepped up load factor from {} to {}", myLastStep, currentFactor);
+                lastSteppedFactor = currentFactor;
                 return true;
             } else {
                 // already done
@@ -63,19 +75,19 @@ boolean couldStep() {
     }
 
     private boolean isNoCoolDown() {
-        if (lastStep == 0) return true;
+        if (lastSteppedFactor == 0) return true;
         long now = System.currentTimeMillis();
-        long elapsed = now - lastStep;
+        long elapsed = now - lastSteppedFactor;
         return elapsed > coolDown.toMillis();
     }
 
     boolean isWarmUpPeriodOver() {
         long now = System.currentTimeMillis();
-        long elapsed = now - start;
+        long elapsed = now - startTimeMs;
         return elapsed > warmUp.toMillis();
     }
 
     public boolean isMaxReached() {
-        return current >= max;
+        return currentFactor >= maxFactor;
     }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 6bf021755..2e574a3fb 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -50,9 +50,12 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
     @Setter(AccessLevel.PACKAGE)
     private WallClock clock = new WallClock();
 
+    static private final int KAFKA_DEFAULT_AUTO_COMMIT_FREQUENCY = 5000;
+
     @Setter
     @Getter
-    private Duration timeBetweenCommits = ofMillis(500);
+//    private Duration timeBetweenCommits = ofMillis(500);
+    private Duration timeBetweenCommits = ofMillis(1000);
 
     private Instant lastCommit = Instant.now();
 
@@ -102,7 +105,12 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
      * Used to request a commit asap
      */
     private final AtomicBoolean commitCommand = new AtomicBoolean(false);
+
     private final DynamicLoadFactor dynamicExtraLoadFactor = new DynamicLoadFactor();
+
+    /**
+     * If the system failed with an exception, it is referenced here.
+     */
     private Exception failureReason;
 
     public boolean isClosedOrFailed() {
@@ -177,7 +185,7 @@ public ParallelEoSStreamProcessor(ParallelConsumerOptions newOptions) {
                 0L, MILLISECONDS,
                 poolQueue);
 
-        this.wm = new WorkManager<>(newOptions, consumer);
+        this.wm = new WorkManager<>(newOptions, consumer, dynamicExtraLoadFactor);
 
         ConsumerManager<K, V> consumerMgr = new ConsumerManager<>(consumer);
 
@@ -260,6 +268,7 @@ public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
         numberOfAssignedPartitions = numberOfAssignedPartitions + partitions.size();
         wm.onPartitionsAssigned(partitions);
         usersConsumerRebalanceListener.ifPresent(x -> x.onPartitionsAssigned(partitions));
+        notifyNewWorkRegistered();
         log.info("Assigned {} partitions - that's {} bytes per partition for encoding offset overruns", numberOfAssignedPartitions, OffsetMapCodecManager.DefaultMaxMetadataSize / numberOfAssignedPartitions);
     }
 
@@ -338,7 +347,9 @@ public void pollAndProduceMany(Function<ConsumerRecord<K, V>, List<ProducerRecor
             log.trace("asyncPoll and Stream - Consumed a record ({}), and returning a derivative result record to be produced: {}", consumedRecord, recordListToProduce);
 
             List<ConsumeProduceResult<K, V, K, V>> results = new ArrayList<>();
+            log.trace("Producing {} messages in result...", recordListToProduce.size());
             for (ProducerRecord<K, V> toProduce : recordListToProduce) {
+                log.trace("Producing {}", toProduce);
                 RecordMetadata produceResultMeta = producerManager.get().produceMessage(toProduce);
                 var result = new ConsumeProduceResult<>(consumedRecord, toProduce, produceResultMeta);
                 results.add(result);
@@ -592,14 +603,17 @@ protected <R> void supervisorLoop(Function<ConsumerRecord<K, V>, List<R>> userFu
      */
     private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunction,
                                  Consumer<R> callback) throws TimeoutException, ExecutionException, InterruptedException {
-        handleWork(userFunction, callback);
+
+        //
+        int newWork = handleWork(userFunction, callback);
 
         if (state == running) {
-            if (!wm.isSufficientlyLoaded()) {
-                log.debug("Found not enough messages queued up, ensuring poller is awake");
-                brokerPollSubsystem.wakeup();
-            } else {
-                log.info("");
+            if (!wm.isSufficientlyLoaded() & brokerPollSubsystem.isPaused()) {
+                // can occur
+                log.debug("Found Poller paused with not enough front loaded messages, ensuring poller is awake (mail: {} vs concurrency: {})",
+                        wm.getWorkQueuedInMailboxCount(),
+                        options.getNumberOfThreads());
+                brokerPollSubsystem.wakeupIfPaused();
             }
         }
 
@@ -636,6 +650,10 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
             log.trace("Woke up", e);
         }
 
+        if (getWorkerQueueSize() == 0 && wm.getTotalWorkWaitingProcessing() > 0 && newWork == 0) {
+            log.error("No work to do, yet messages waiting in shard queue");
+        }
+
         // end of loop
         log.trace("End of control loop, waiting processing {}, remaining in partition queues: {}, out for processing: {}. In state: {}",
                 wm.getTotalWorkWaitingProcessing(), wm.getNumberOfEntriesInPartitionQueues(), wm.getRecordsOutForProcessing(), state);
@@ -643,38 +661,61 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
 
     RateLimiter rateLimiter = new RateLimiter();
 
-    private <R> void handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFunction, final Consumer<R> callback) {
+    private <R> int handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFunction, final Consumer<R> callback) {
+        // check queue pressure first before addressing it
+        checkPressure();
+
+        int gotWorkCount = 0;
+
+        //
         if (state == running || state == draining) {
-            int dynamicExtraLoadFactorCurrent = dynamicExtraLoadFactor.getCurrent();
-            int target = getPoolQueueTarget() * dynamicExtraLoadFactorCurrent;
+            int target = getQueueTargetLoaded();
             BlockingQueue<Runnable> queue = workerPool.getQueue();
             int current = queue.size();
             int delta = target - current;
 
-            log.debug("Loop: Get work - target: {} current queue size: {}, requesting: {}, loading factor: {}", target, current, delta, dynamicExtraLoadFactorCurrent);
+            log.debug("Loop: Get work - target: {}, current queue size: {}, requesting: {}, loading factor: {}", target, current, delta, dynamicExtraLoadFactor.getCurrentFactor());
             var records = wm.<R>maybeGetWork(delta);
+            gotWorkCount = records.size();
 
             log.trace("Loop: Submit to pool");
             submitWorkToPool(userFunction, callback, records);
         }
 
-        boolean moreWorkInQueuesAvailableThatHasntBeenPulled = wm.getWorkQueuedInMailboxCount() > options.getNumberOfThreads();
+        //
+        rateLimiter.performIfNotLimited(() -> {
+            int queueSize = getWorkerQueueSize();
+            log.info("Stats: \n- pool active: {} queued:{} \n- queue size: {} target: {} loading factor: {}",
+                    workerPool.getActiveCount(), queueSize, queueSize, getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrentFactor());
+        });
+
+        return gotWorkCount;
+    }
+
+    private int getQueueTargetLoaded() {
+        return getPoolQueueTarget() * dynamicExtraLoadFactor.getCurrentFactor();
+    }
+
+    private void checkPressure() {
+        boolean moreWorkInQueuesAvailableThatHaveNotBeenPulled = wm.getWorkQueuedInMailboxCount() > options.getNumberOfThreads();
 //        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
-        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver() && moreWorkInQueuesAvailableThatHasntBeenPulled) {
+        if (log.isTraceEnabled())
+            log.trace("Queue pressure check: (current size: {}, loaded target: {}, factor: {}) if (isPoolQueueLow() {} && dynamicExtraLoadFactor.isWarmUpPeriodOver() {} && moreWorkInQueuesAvailableThatHaveNotBeenPulled {}) {",
+                    getWorkerQueueSize(),
+                    getQueueTargetLoaded(),
+                    dynamicExtraLoadFactor.getCurrentFactor(),
+                    isPoolQueueLow(),
+                    dynamicExtraLoadFactor.isWarmUpPeriodOver(),
+                    moreWorkInQueuesAvailableThatHaveNotBeenPulled);
+        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver() && moreWorkInQueuesAvailableThatHaveNotBeenPulled) {
             boolean steppedUp = dynamicExtraLoadFactor.maybeStepUp();
             if (steppedUp) {
-                log.warn("Executor pool queue is not loaded with enough work (queue: {} vs target: {}), stepped up loading factor to {}",
-                        workerPool.getQueue().size(), getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrent());
+                log.warn("isPoolQueueLow(): Executor pool queue is not loaded with enough work (queue: {} vs target: {}), stepped up loading factor to {}",
+                        getWorkerQueueSize(), getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrentFactor());
             } else if (dynamicExtraLoadFactor.isMaxReached()) {
-                log.warn("Max loading factor steps reached: {}/{}", dynamicExtraLoadFactor.getCurrent(), dynamicExtraLoadFactor.getMax());
+                log.warn("isPoolQueueLow(): Max loading factor steps reached: {}/{}", dynamicExtraLoadFactor.getCurrentFactor(), dynamicExtraLoadFactor.getMaxFactor());
             }
         }
-
-        rateLimiter.limit(() -> {
-            int queueSize = workerPool.getQueue().size();
-            log.info("Stats: \n- pool active: {} queued:{} \n- queue size: {} target: {} loading factor: {}",
-                    workerPool.getActiveCount(), queueSize, queueSize, getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrent());
-        });
     }
 
     /**
@@ -685,11 +726,19 @@ private int getPoolQueueTarget() {
     }
 
     private boolean isPoolQueueLow() {
-        double ninteyPercent = 0.9; // at least 90% of threads are utilised
-        boolean threadsUnderUtilised = workerPool.getActiveCount() < (options.getNumberOfThreads() * ninteyPercent);
-        return getPoolQueueTarget() > workerPool.getQueue().size()
-                && wm.isNotPartitionedOrDrained()
-                && threadsUnderUtilised;
+//        double ninteyPercent = 0.9; // at least 90% of threads are utilised
+//        boolean threadsUnderUtilised = workerPool.getActiveCount() < (options.getNumberOfThreads() * ninteyPercent);
+//        boolean threadsUnderUtilised = true;
+        int queueSize = getWorkerQueueSize();
+        boolean workAmountBelowTarget = queueSize <= getPoolQueueTarget();
+        log.debug("workAmountBelowTarget {} {} vs {} && wm.hasWorkInMailboxes() {};",
+                workAmountBelowTarget, queueSize, getPoolQueueTarget(), wm.hasWorkInMailboxes()
+                //, threadsUnderUtilised
+        );
+        return workAmountBelowTarget
+                && wm.hasWorkInMailboxes()
+                ;
+//                && threadsUnderUtilised;
     }
 
     private void drain() {
@@ -720,14 +769,32 @@ private void processWorkCompleteMailBox() {
         Set<WorkContainer<K, V>> results = new HashSet<>();
         final Duration timeout = getTimeToNextCommit(); // don't sleep longer than when we're expected to maybe commit
 
+        boolean nothingInFlight = !wm.hasWorkInFlight();
+//        if (nothingInFlight && wm.hasWorkInMailboxes()) {
+//        boolean willNeverReceiveWork = getWorkerQueueSize() < 1 && workerPool.getActiveCount() == 0;
+//        if (willNeverReceiveWork && workMailBox.isEmpty() && numberOfAssignedPartitions > 0) {
+//            log.debug("No work in flight and mail box empty, need to load up more work");
+//            try {
+//                Thread.sleep(1);
+//            } catch (InterruptedException e) {
+//                e.printStackTrace();
+//            }
+//            return;
+//        }
+
         // blocking get the head of the queue
         WorkContainer<K, V> firstBlockingPoll = null;
         try {
             if (workMailBox.isEmpty()) {
-                log.debug("Blocking poll on work until next scheduled offset commit attempt for {}", timeout);
+                if (log.isDebugEnabled()) {
+                    log.warn("Blocking poll on work until next scheduled offset commit attempt for {}. active threads: {}, queue: {}",
+                            timeout, workerPool.getActiveCount(), getWorkerQueueSize());
+                }
                 currentlyPollingWorkCompleteMailBox.getAndSet(true);
                 // wait for work, with a timeout for sanity
+                log.warn("Blocking poll {}", timeout);
                 firstBlockingPoll = workMailBox.poll(timeout.toMillis(), MILLISECONDS);
+                log.warn("Blocking poll finish");
                 currentlyPollingWorkCompleteMailBox.getAndSet(false);
             } else {
                 // don't set the lock or log anything
@@ -762,15 +829,31 @@ private void processWorkCompleteMailBox() {
     private void commitOffsetsMaybe() {
         Duration elapsedSinceLast = getTimeSinceLastCommit();
         boolean commitFrequencyOK = toSeconds(elapsedSinceLast) >= toSeconds(timeBetweenCommits);
-        boolean poolQueueLow = isPoolQueueLow();
-        boolean shouldCommitNow = commitFrequencyOK || !lingeringOnCommitWouldBeBeneficial() || isCommandedToCommit() || poolQueueLow;
+//        boolean poolQueueLow = isPoolQueueLow();
+        boolean lingerBeneficial = lingeringOnCommitWouldBeBeneficial();
+        boolean commitCommand = isCommandedToCommit();
+//        boolean shouldCommitNow = commitFrequencyOK || !lingerBeneficial || commitCommand || poolQueueLow;
+        boolean shouldCommitNow = commitFrequencyOK || !lingerBeneficial || commitCommand;
         if (shouldCommitNow) {
-            if (!commitFrequencyOK) {
-                log.debug("Commit too frequent, but no benefit in lingering");
-            }
-            if (poolQueueLow)
-                // todo got to change this - commits are ever few ms
-                log.debug("Pool queue too low so committing offsets");
+//            log.debug("commitFrequencyOK {} || !lingerBeneficial {} || commitCommand {} || poolQueueLow {}",
+//                    commitFrequencyOK,
+//                    !lingerBeneficial,
+//                    commitCommand,
+//                    poolQueueLow
+//            );
+            log.debug("commitFrequencyOK {} || !lingerBeneficial {} || commitCommand {}",
+                    commitFrequencyOK,
+                    !lingerBeneficial,
+                    commitCommand
+            );
+//            if (poolQueueLow) {
+//                /*
+//                Shouldn't be needed if pressure system is working, unless commit frequency target too high or too much
+//                information to encode into offset payload.
+//                // TODO should be able to change this so that it checks with the work manager if a commit would help
+//                */
+//                log.warn("Pool queue too low ({}), may be because of back pressure from encoding offsets, so committing", getWorkerQueueSize());
+//            }
             commitOffsetsThatAreReady();
             lastCommit = Instant.now();
         } else {
@@ -784,6 +867,10 @@ private void commitOffsetsMaybe() {
         }
     }
 
+    private int getWorkerQueueSize() {
+        return workerPool.getQueue().size();
+    }
+
     /**
      * Under some conditions, waiting longer before committing can be faster
      *
@@ -793,11 +880,12 @@ private boolean lingeringOnCommitWouldBeBeneficial() {
         // work is waiting to be done
         boolean workIsWaitingToBeCompletedSuccessfully = wm.workIsWaitingToBeCompletedSuccessfully();
         // no work is currently being done
-        boolean noWorkInFlight = !wm.hasWorkInFlight();
+        boolean workInFlight = wm.hasWorkInFlight();
         // work mailbox is empty
         boolean workWaitingInMailbox = !workMailBox.isEmpty();
-        log.trace("workIsWaitingToBeCompletedSuccessfully {} || noWorkInFlight {} || workWaitingInMailbox {};", workIsWaitingToBeCompletedSuccessfully, noWorkInFlight, workWaitingInMailbox);
-        return workIsWaitingToBeCompletedSuccessfully || noWorkInFlight || workWaitingInMailbox;
+        boolean workWaitingToCommit = wm.hasWorkInCommitQueues();
+        log.trace("workIsWaitingToBeCompletedSuccessfully {} || workInFlight {} || workWaitingInMailbox {} || !workWaitingToCommit {};", workIsWaitingToBeCompletedSuccessfully, workInFlight, workWaitingInMailbox, !workWaitingToCommit);
+        return workIsWaitingToBeCompletedSuccessfully || workInFlight || workWaitingInMailbox || !workWaitingToCommit;
     }
 
     private Duration getTimeToNextCommit() {
@@ -883,7 +971,7 @@ protected <R> List<Tuple<ConsumerRecord<K, V>, R>> userFunctionRunner(Function<C
             // capture each result, against the input record
             var intermediateResults = new ArrayList<Tuple<ConsumerRecord<K, V>, R>>();
             for (R result : resultsFromUserFunction) {
-                log.trace("Running users's call back...");
+                log.trace("Running users call back...");
                 callback.accept(result);
             }
             log.trace("User function future registered");
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
index cf06d9063..6ec0d3450 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
@@ -1,5 +1,6 @@
 package io.confluent.parallelconsumer;
 
+import io.confluent.csid.utils.TimeUtils;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerGroupMetadata;
@@ -8,6 +9,7 @@
 import org.apache.kafka.clients.producer.internals.TransactionManager;
 import org.apache.kafka.common.KafkaException;
 import org.apache.kafka.common.TopicPartition;
+import org.apache.kafka.common.utils.Timer;
 
 import java.lang.reflect.Field;
 import java.lang.reflect.Method;
@@ -15,10 +17,10 @@
 import java.util.ConcurrentModificationException;
 import java.util.Map;
 import java.util.concurrent.Future;
+import java.util.concurrent.TimeUnit;
 import java.util.concurrent.locks.ReentrantReadWriteLock;
 
 import static io.confluent.csid.utils.StringUtils.msg;
-import static io.confluent.parallelconsumer.ParallelEoSStreamProcessor.State.closing;
 
 @Slf4j
 public class ProducerManager<K, V> extends AbstractOffsetCommitter<K, V> implements OffsetCommitter {
@@ -40,6 +42,7 @@ public class ProducerManager<K, V> extends AbstractOffsetCommitter<K, V> impleme
     private Field txManagerField;
     private Method txManagerMethodIsCompleting;
     private Method txManagerMethodIsReady;
+    private final long sendTimeoutSeconds = 1L;
 
     public ProducerManager(final Producer<K, V> newProducer, final ConsumerManager<K, V> newConsumer, final WorkManager<K, V> wm, ParallelConsumerOptions options) {
         super(newConsumer, wm);
@@ -133,9 +136,13 @@ RecordMetadata produceMessage(ProducerRecord<K, V> outMsg) {
 
         // wait on the send results
         try {
-            return send.get();
+            log.trace("Blocking on produce result");
+            RecordMetadata recordMetadata = TimeUtils.time(() ->
+                    send.get(sendTimeoutSeconds, TimeUnit.SECONDS));
+            log.trace("Produce result received");
+            return recordMetadata;
         } catch (Exception e) {
-            throw new RuntimeException(e);
+            throw new InternalRuntimeError(e);
         }
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java
index ca3d894d3..14c56d44f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RateLimiter.java
@@ -1,14 +1,15 @@
 package io.confluent.parallelconsumer;
 
+import lombok.Getter;
 import lombok.SneakyThrows;
 
 import java.time.Duration;
-import java.util.concurrent.Callable;
 
 public class RateLimiter {
 
+    @Getter
     private Duration rate = Duration.ofSeconds(1);
-    private long lastFire = 0;
+    private long lastFireMs = 0;
 
     public RateLimiter() {
     }
@@ -18,17 +19,30 @@ public RateLimiter(int seconds) {
     }
 
     @SneakyThrows
-    public void limit(final Runnable action) {
+    public void performIfNotLimited(final Runnable action) {
         if (isOkToCallAction()) {
-            lastFire = System.currentTimeMillis();
+            lastFireMs = System.currentTimeMillis();
             action.run();
         }
     }
 
+    public boolean couldPerform() {
+        return isOkToCallAction();
+    }
+
     private boolean isOkToCallAction() {
+        long elapsed = getElapsedMs();
+        return lastFireMs == 0 || elapsed > rate.toMillis();
+    }
+
+    private long getElapsedMs() {
         long now = System.currentTimeMillis();
-        long elapsed = now - lastFire;
-        return lastFire == 0 || elapsed > rate.toMillis();
+        long elapsed = now - lastFireMs;
+        return elapsed;
+    }
+
+    public Duration getElapsedDuration() {
+        return Duration.ofMillis(getElapsedMs());
     }
 
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
index e517b36d4..6b5c9179c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
@@ -52,6 +52,7 @@ public class WorkContainer<K, V> implements Comparable<WorkContainer> {
     @Getter
     @Setter(AccessLevel.PUBLIC)
     private Future<List<Object>> future;
+    private long timeTakenAsWorkMs;
 
     public WorkContainer(ConsumerRecord<K, V> cr) {
         this.cr = cr;
@@ -111,6 +112,7 @@ public boolean isNotInFlight() {
     public void takingAsWork() {
         log.trace("Being taken as work: {}", this);
         inFlight = true;
+        timeTakenAsWorkMs = System.currentTimeMillis();
     }
 
     public TopicPartition getTopicPartition() {
@@ -139,4 +141,8 @@ public String toString() {
 //        return "WorkContainer(" + toTP(cr) + ":" + cr.offset() + ":" + cr.key() + ":" + cr.value() + ")";
         return "WorkContainer(" + toTP(cr) + ":" + cr.offset() + ":" + cr.key() + ")";
     }
+
+    public Duration getTimeInFlight() {
+        return Duration.ofMillis(System.currentTimeMillis()-timeTakenAsWorkMs);
+    }
 }
\ No newline at end of file
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index 7f1f2a8cc..b5079d8c9 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -70,6 +70,8 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      */
     private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new ConcurrentHashMap<>();
 
+    private final DynamicLoadFactor dynamicLoadFactor;
+
     /**
      * Iteration resume point, to ensure fairness (prevent shard starvation) when we can't process messages from every
      * shard.
@@ -78,16 +80,6 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
 
     private int recordsOutForProcessing = 0;
 
-    /**
-     * todo docs
-     * The multiple that should be pre-loaded awaiting processing. Consumer already pipelines, so we shouldn't need to
-     * pipeline ourselves too much.
-     * <p>
-     * Note how this relates to {@link BrokerPollSystem#getLongPollTimeout()} - if longPollTimeout is high and loading
-     * factor is low, there may not be enough messages queued up to satisfy demand.
-     */
-    private final int loadingFactor = 3;
-
     /**
      * Useful for testing
      */
@@ -122,9 +114,15 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      */
     private AtomicBoolean workStateIsDirtyNeedsCommitting = new AtomicBoolean(false);
 
+    // TODO remove
     public WorkManager(ParallelConsumerOptions options, org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
-        this.options = options;
+        this(options, consumer, new DynamicLoadFactor());
+    }
+
+    public WorkManager(final ParallelConsumerOptions newOptions, final org.apache.kafka.clients.consumer.Consumer<K, V> consumer, final DynamicLoadFactor dynamicExtraLoadFactor) {
+        this.options = newOptions;
         this.consumer = consumer;
+        this.dynamicLoadFactor = dynamicExtraLoadFactor;
     }
 
     /**
@@ -244,7 +242,7 @@ private void processInbox(final int requestedMaxWorkToRetrieve) {
         int gap = requestedMaxWorkToRetrieve;
         int taken = 0;
 
-        log.debug("Will attempt to register {} - {} available", requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
+        log.debug("Will attempt to register the requested {} - {} available", requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
 
         //
         while (taken < gap && !internalFlattenedMailQueue.isEmpty()) {
@@ -323,7 +321,10 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
             return UniLists.of();
         }
 
-        int extraNeededFromInboxToSatisfy = requestedMaxWorkToRetrieve - getWorkQueuedInShardsCount();
+        // todo this counts all partitions as a whole - this may cause some partitions to starve. need to round robin it?
+        int available = getWorkQueuedInShardsCount();
+        int extraNeededFromInboxToSatisfy = requestedMaxWorkToRetrieve - available;
+        log.debug("Requested: {}, available: {}, will try retrieve from mailbox the delta of: {}", requestedMaxWorkToRetrieve, available, extraNeededFromInboxToSatisfy);
         processInbox(extraNeededFromInboxToSatisfy);
 
         //
@@ -360,7 +361,8 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
                     wc.takingAsWork();
                     shardWork.add(wc);
                 } else {
-                    log.trace("Work ({}) still delayed or is in flight, can't take...", wc);
+                    log.trace("Work ({}) still delayed ({}) or is in flight ({}, time in flight: {}), alreadySucceeded? {} can't take...",
+                            wc, !wc.hasDelayPassed(clock), !wc.isNotInFlight(), wc.getTimeInFlight(), alreadySucceeded);
                 }
 
                 ProcessingOrder ordering = options.getOrdering();
@@ -377,8 +379,7 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
             work.addAll(shardWork);
         }
 
-
-        log.debug("Got {} records of work. In-flight: {}, Awaiting: {}", work.size(), getRecordsOutForProcessing(), getNumberOfEntriesInPartitionQueues());
+        log.debug("Got {} records of work. In-flight: {}, Awaiting in commit queues: {}", work.size(), getRecordsOutForProcessing(), getNumberOfEntriesInPartitionQueues());
         recordsOutForProcessing += work.size();
 
         return work;
@@ -438,7 +439,9 @@ public int getTotalWorkWaitingProcessing() {
     }
 
     /**
-     * @return Work queued in the mail box, awaiting processing into shards
+     * TODO use a cache of this information, readable from a seperate thread
+     *
+     * @return amount of work queued in the mail box, awaiting processing into shards
      */
     Integer getWorkQueuedInMailboxCount() {
         int batchCount = 0;
@@ -448,7 +451,7 @@ Integer getWorkQueuedInMailboxCount() {
         if (internalBatchMailQueue.size() > 10) {
             log.warn("Larger than expected {}", internalBatchMailQueue.size());
         }
-        for (final ConsumerRecords<K, V> consumerRecords : new ArrayList<>(internalBatchMailQueue)) { // copy for concurrent access - as it holds batches of polled records, it should be relatively small
+        for (final ConsumerRecords<K, V> consumerRecords : new ArrayList<>(internalBatchMailQueue)) { // TODO copy for concurrent access - as it holds batches of polled records, it should be relatively small
             if (consumerRecords != null) {
                 batchCount += consumerRecords.count();
             }
@@ -531,7 +534,9 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
                         OffsetAndMetadata offsetData = new OffsetAndMetadata(offsetOfNextExpectedMessageToBeCommitted);
                         offsetsToSend.put(topicPartitionKey, offsetData);
                     } else if (container.getUserFunctionSucceeded().get() && iteratedBeyondLowWaterMarkBeingLowestCommittableOffset) {
-                        log.trace("Offset {} is complete and succeeded, but we've iterated past the lowest committable offset. Will mark as complete in the offset map.", container.getCr().offset());
+                        // todo lookup the low water mark and include here
+                        log.trace("Offset {} is complete and succeeded, but we've iterated past the lowest committable offset. Will mark as complete in the offset map.",
+                                container.getCr().offset());
                         // no-op - offset map is only for not succeeded or completed offsets
 //                        // mark as complete complete so remove from work
 //                        workToRemove.add(container);
@@ -650,13 +655,31 @@ public boolean shouldThrottle() {
      *         should be downloaded (or pipelined in the Consumer)
      */
     boolean isSufficientlyLoaded() {
-        return !workInbox.isEmpty();
+//        int total = getTotalWorkWaitingProcessing();
+//        int inPartitions = getNumberOfEntriesInPartitionQueues();
+//        int maxBeyondOffset = getMaxToGoBeyondOffset();
+//        boolean loadedEnoughInPipeline = total > maxBeyondOffset * loadingFactor;
+//        boolean overMaxUncommitted = inPartitions >= maxBeyondOffset;
+//        boolean remainingIsSufficient = loadedEnoughInPipeline || overMaxUncommitted;
+////        if (remainingIsSufficient) {
+//        log.debug("isSufficientlyLoaded? loadedEnoughInPipeline {} || overMaxUncommitted {}", loadedEnoughInPipeline, overMaxUncommitted);
+////        }
+//        return remainingIsSufficient;
+//
+//        return !workInbox.isEmpty();
+
+        return getWorkQueuedInMailboxCount() > options.getNumberOfThreads() * getLoadingFactor();
+    }
+
+    private int getLoadingFactor() {
+        return dynamicLoadFactor.getCurrentFactor();
     }
 
     public int getRecordsOutForProcessing() {
         return recordsOutForProcessing;
     }
 
+    // TODO effeciency issues
     public boolean workIsWaitingToBeCompletedSuccessfully() {
         Collection<NavigableMap<Long, WorkContainer<K, V>>> values = processingShards.values();
         for (NavigableMap<Long, WorkContainer<K, V>> value : values) {
@@ -678,8 +701,20 @@ private boolean isDirty() {
         return this.workStateIsDirtyNeedsCommitting.get();
     }
 
-    public boolean isNotPartitionedOrDrained() {
-        return getNumberOfEntriesInPartitionQueues() > 0 && getWorkQueuedInMailboxCount() > 0;
+    public boolean hasWorkInMailboxes() {
+        return getWorkQueuedInMailboxCount() > 0;
+    }
 
+    /**
+     * fastish
+     *
+     * @return
+     */
+    public boolean hasWorkInCommitQueues() {
+        for (var e : this.partitionCommitQueues.entrySet()) {
+            if (!e.getValue().isEmpty())
+                return true;
+        }
+        return false;
     }
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index 2a10c5fec..5fb81cb16 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -35,8 +35,7 @@
 import java.util.stream.Collectors;
 import java.util.stream.IntStream;
 
-import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.CONSUMER_SYNC;
-import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.TRANSACTIONAL_PRODUCER;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.*;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.time.Duration.ofSeconds;
@@ -75,7 +74,7 @@ void testDefaultMaxPoll(CommitMode commitMode, ProcessingOrder order) {
     }
 
     @Test
-    void testDefaultMaxPollSlow() {
+    void testDefaultMaxPollConsumerSyncSlow() {
         runTest(DEFAULT_MAX_POLL_RECORDS_CONFIG, CONSUMER_SYNC, UNORDERED);
     }
 
@@ -109,7 +108,9 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
         // pre-produce messages to input-topic
         List<String> expectedKeys = new ArrayList<>();
-        int expectedMessageCount = 1000;
+        int expectedMessageCount = 50_000;
+//        int expectedMessageCount = 10_000;
+//        int expectedMessageCount = 1_000;
         log.info("Producing {} messages before starting test", expectedMessageCount);
         List<Future<RecordMetadata>> sends = new ArrayList<>();
         try (Producer<String, String> kafkaProducer = kcu.createNewProducer(false)) {
@@ -145,6 +146,9 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                 .consumer(newConsumer)
                 .producer(newProducer)
                 .commitMode(commitMode)
+//                .numberOfThreads(1000)
+//                .numberOfThreads(100)
+//                .numberOfThreads(2)
                 .build());
         pc.subscribe(of(inputName));
 
@@ -157,7 +161,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
 
         pc.pollAndProduce(record -> {
-                    log.trace("Still going {}", record);
+                    log.trace("Still going {}", record.offset());
                     consumedKeys.add(record.key());
                     processedCount.incrementAndGet();
                     return new ProducerRecord<>(outputName, record.key(), "data");
@@ -169,13 +173,23 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
         // wait for all pre-produced messages to be processed and produced
         Assertions.useRepresentation(new TrimListRepresentation());
-        ProgressTracker pt = new ProgressTracker(processedCount);
+
+        // todo rounds should be 1? progress should always be made
+        int roundsAllowed = 1;
+        if (commitMode.equals(CONSUMER_SYNC)) {
+            roundsAllowed = 2; // sync consumer commits can take time // fails
+//            roundsAllowed = 5; // sync consumer commits can take time // fails
+//            roundsAllowed = 10; // sync consumer commits can take time // fails
+//            roundsAllowed = 12; // sync consumer commits can take time // // works with no logging
+        }
+
+        ProgressTracker pt = new ProgressTracker(processedCount, roundsAllowed);
         var failureMessage = StringUtils.msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
             waitAtMost(ofSeconds(20)).alias(failureMessage).untilAsserted(() -> {
                 log.info("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
-                pt.checkForProgress();
+                pt.checkForProgressExceptionally();
                 SoftAssertions all = new SoftAssertions();
                 all.assertThat(new ArrayList<>(consumedKeys)).as("all expected are consumed").hasSameSizeAs(expectedKeys);
                 all.assertThat(new ArrayList<>(producedKeysAcknowledged)).as("all consumed are produced ok ").hasSameSizeAs(expectedKeys);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
index 54fbb52a0..9d32d8a8f 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
@@ -10,37 +10,47 @@
 @RequiredArgsConstructor
 public class ProgressTracker {
 
+    public static final int WARMED_UP_AFTER_X_MESSAGES = 50;
     private final AtomicInteger processedCount;
     private final AtomicInteger lastSeen = new AtomicInteger(0);
     private final AtomicInteger rounds = new AtomicInteger(0);
-    private final int roundsAllowed = 3;
-    private final int coldRoundsAllowed = 20;
+    private int roundsAllowed = 3;
+    private int coldRoundsAllowed = 20;
+
+    public ProgressTracker(final AtomicInteger processedCount, int roundsAllowed) {
+        this.processedCount = processedCount;
+        this.roundsAllowed = roundsAllowed;
+    }
 
     /**
-     * @return true if progress has been made, false if not
+     * @return false if progress has been made, true otherwise
      */
-    public boolean checkForProgress() {
+    public boolean hasProgressNotBeenMade() {
         boolean progress = processedCount.get() > lastSeen.get();
-        boolean warmedUp = processedCount.get() > 0;
+        boolean warmedUp = processedCount.get() > WARMED_UP_AFTER_X_MESSAGES;
         boolean enoughAttempts = rounds.get() > roundsAllowed;
         if (warmedUp && !progress && enoughAttempts) {
             return true;
-        } else if (progress) {
-            rounds.set(0);
         } else if (!warmedUp && rounds.get() > coldRoundsAllowed) {
             return true;
+        } else if (progress) {
+            rounds.set(0);
         }
         lastSeen.set(processedCount.get());
         rounds.incrementAndGet();
         return false;
     }
 
-    public void checkForProgressExceptionally() {
-        boolean progress = checkForProgress();
-        if (!progress) throw new InternalRuntimeError("No progress");
+    /**
+     * @throws Exception If no progress is made
+     */
+    public void checkForProgressExceptionally() throws Exception {
+        boolean progress = hasProgressNotBeenMade();
+        if (progress)
+            throw constructError();
     }
 
-    public Exception getError() {
+    public Exception constructError() {
         return new InternalRuntimeError(msg("No progress beyond {} records after {} rounds", processedCount, rounds));
     }
 }
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 9fad2dd93..63dd8b802 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -28,8 +28,8 @@
     <!-- primary -->
     <logger name="io.confluent.parallelconsumer" level="info"/>
     <logger name="io.confluent.parallelconsumer" level="debug"/>
-    <!--    <logger name="io.confluent.parallelconsumer" level="trace"/>-->
-<!--            <logger name="io.confluent.parallelconsumer.ParallelEoSStreamProcessor" level="debug"/>-->
+<!--        <logger name="io.confluent.parallelconsumer" level="trace"/>-->
+<!--            <logger name="io.confluent.parallelconsumer.ParallelEoSStreamProcessor" level="trace"/>-->
 <!--        <logger name="io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest" level="info"/> &lt;!&ndash; docker logs &ndash;&gt;-->
     <!--    <logger name="io.confluent.csid" level="info"/>-->
     <!--    <logger name="io.confluent.csid.utils" level="debug"/>-->

From 7343293772512f5169e3c7de3ae6976959e57de9 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 9 Dec 2020 23:06:43 +0000
Subject: [PATCH 009/131] Cached info for mail boxes for thread safety

---
 .../io/confluent/csid/utils/LogUtils.java     | 11 +++
 .../CountingCRLinkedList.java                 | 29 +++++++
 .../parallelconsumer/DynamicLoadFactor.java   |  2 +-
 .../ParallelEoSStreamProcessor.java           |  4 +-
 .../parallelconsumer/WorkContainer.java       |  4 +
 .../parallelconsumer/WorkMailBoxManager.java  | 76 +++++++++++++++++
 .../parallelconsumer/WorkManager.java         | 82 +++++++------------
 .../TransactionAndCommitModeTest.java         | 45 ++++++----
 .../src/test/resources/logback-test.xml       |  6 +-
 9 files changed, 184 insertions(+), 75 deletions(-)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/csid/utils/LogUtils.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkMailBoxManager.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/LogUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/LogUtils.java
new file mode 100644
index 000000000..c570af8fc
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/LogUtils.java
@@ -0,0 +1,11 @@
+package io.confluent.csid.utils;
+
+import org.slf4j.Logger;
+import org.slf4j.event.Level;
+import org.slf4j.spi.LoggingEventBuilder;
+
+public class LogUtils {
+    public static LoggingEventBuilder at(final Logger log, final Level level) {
+        return log.makeLoggingEventBuilder(level);
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java
new file mode 100644
index 000000000..275c55a0e
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java
@@ -0,0 +1,29 @@
+package io.confluent.parallelconsumer;
+
+import lombok.Getter;
+import org.apache.kafka.clients.consumer.ConsumerRecords;
+
+import java.util.LinkedList;
+import java.util.Queue;
+
+/**
+ * Cached view of the nested number of records in this queue
+ */
+public class CountingCRLinkedList<K, V> extends LinkedList<ConsumerRecords<K, V>> implements Queue<ConsumerRecords<K, V>> {
+
+    @Getter
+    private int nestedCount = 0;
+
+    @Override
+    public void add(final int index, final ConsumerRecords<K, V> element) {
+        nestedCount = nestedCount + element.count();
+        super.add(index, element);
+    }
+
+    @Override
+    public ConsumerRecords<K, V> poll() {
+        ConsumerRecords<K, V> poll = super.poll();
+        nestedCount = nestedCount - poll.count();
+        return poll;
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
index e8d427c59..2a986bd24 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
@@ -58,7 +58,7 @@ private synchronized boolean doStep(final long nowMs, final long myLastStep) {
             if (myLastStep == lastSteppedFactor) {
                 currentFactor = currentFactor + stepUpFactorBy;
                 long delta = currentFactor - myLastStep;
-                log.debug("Stepped up load factor from {} to {}", myLastStep, currentFactor);
+                log.info("Stepped up load factor from {} to {}", myLastStep, currentFactor);
                 lastSteppedFactor = currentFactor;
                 return true;
             } else {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 2e574a3fb..524c1af4c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -792,9 +792,9 @@ private void processWorkCompleteMailBox() {
                 }
                 currentlyPollingWorkCompleteMailBox.getAndSet(true);
                 // wait for work, with a timeout for sanity
-                log.warn("Blocking poll {}", timeout);
+                log.trace("Blocking poll {}", timeout);
                 firstBlockingPoll = workMailBox.poll(timeout.toMillis(), MILLISECONDS);
-                log.warn("Blocking poll finish");
+                log.trace("Blocking poll finish");
                 currentlyPollingWorkCompleteMailBox.getAndSet(false);
             } else {
                 // don't set the lock or log anything
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
index 6b5c9179c..c7cfff49b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
@@ -145,4 +145,8 @@ public String toString() {
     public Duration getTimeInFlight() {
         return Duration.ofMillis(System.currentTimeMillis()-timeTakenAsWorkMs);
     }
+
+    public long offset() {
+        return getCr().offset();
+    }
 }
\ No newline at end of file
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkMailBoxManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkMailBoxManager.java
new file mode 100644
index 000000000..ec34e20ee
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkMailBoxManager.java
@@ -0,0 +1,76 @@
+package io.confluent.parallelconsumer;
+
+import lombok.Getter;
+import lombok.extern.slf4j.Slf4j;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.clients.consumer.ConsumerRecords;
+
+import java.util.LinkedList;
+import java.util.Queue;
+import java.util.concurrent.LinkedBlockingQueue;
+import java.util.concurrent.atomic.AtomicInteger;
+
+@Slf4j
+public class WorkMailBoxManager<K, V> {
+
+    private int sharedBoxCount;
+
+    private final LinkedBlockingQueue<ConsumerRecords<K, V>> workInbox = new LinkedBlockingQueue<>();
+
+    private final CountingCRLinkedList<K, V> internalBatchMailQueue = new CountingCRLinkedList<>();
+
+    // TODO when partition state is also refactored, remove Getter
+    @Getter
+    private final Queue<ConsumerRecord<K, V>> internalFlattenedMailQueue = new LinkedList<>();
+
+    /**
+     * @return amount of work queued in the mail box, awaiting processing into shards, not exact
+     */
+    Integer getWorkQueuedInMailboxCount() {
+        return sharedBoxCount +
+                internalBatchMailQueue.getNestedCount() +
+                internalFlattenedMailQueue.size();
+    }
+
+    /**
+     * Work must be registered in offset order
+     * <p>
+     * Thread safe for use by control and broker poller thread.
+     *
+     * @see WorkManager#success
+     * @see WorkManager#raisePartitionHighWaterMark
+     */
+    public void registerWork(final ConsumerRecords<K, V> records) {
+        synchronized (workInbox) {
+            sharedBoxCount += records.count();
+            workInbox.add(records);
+        }
+    }
+
+    private void drainSharedMailbox() {
+        synchronized (workInbox) {
+            workInbox.drainTo(internalBatchMailQueue);
+            sharedBoxCount = 0;
+        }
+    }
+
+    /**
+     * Take our inbound messages from the {@link BrokerPollSystem} and add them to our registry.
+     *
+     * @param requestedMaxWorkToRetrieve
+     */
+    public void processInbox(final int requestedMaxWorkToRetrieve) {
+        drainSharedMailbox();
+
+        // flatten
+        while (!internalBatchMailQueue.isEmpty()) {
+            ConsumerRecords<K, V> consumerRecords = internalBatchMailQueue.poll();
+            log.debug("Flattening {} records", consumerRecords.count());
+            for (final ConsumerRecord<K, V> consumerRecord : consumerRecords) {
+                internalFlattenedMailQueue.add(consumerRecord);
+            }
+        }
+    }
+
+
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index b5079d8c9..2618eebb5 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -4,6 +4,7 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.LogUtils;
 import io.confluent.csid.utils.LoopingResumingIterator;
 import io.confluent.csid.utils.WallClock;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
@@ -15,9 +16,11 @@
 import org.apache.kafka.clients.consumer.ConsumerRecords;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
+import org.slf4j.event.Level;
 import pl.tlinkowski.unij.api.UniLists;
 import pl.tlinkowski.unij.api.UniSets;
 
+import java.time.Duration;
 import java.util.*;
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.concurrent.ConcurrentSkipListMap;
@@ -26,6 +29,7 @@
 import java.util.function.Consumer;
 
 import static io.confluent.csid.utils.KafkaUtils.toTP;
+import static io.confluent.csid.utils.LogUtils.at;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.lang.Math.min;
@@ -55,7 +59,6 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      * @see #maybeGetWork()
      */
     private final Map<Object, NavigableMap<Long, WorkContainer<K, V>>> processingShards = new ConcurrentHashMap<>();
-    private final LinkedBlockingQueue<ConsumerRecords<K, V>> workInbox = new LinkedBlockingQueue<>();
 
     /**
      * Map of partitions to Map of offsets to WorkUnits
@@ -72,6 +75,8 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
 
     private final DynamicLoadFactor dynamicLoadFactor;
 
+    private final WorkMailBoxManager<K ,V> wmbm;
+
     /**
      * Iteration resume point, to ensure fairness (prevent shard starvation) when we can't process messages from every
      * shard.
@@ -123,6 +128,7 @@ public WorkManager(final ParallelConsumerOptions newOptions, final org.apache.ka
         this.options = newOptions;
         this.consumer = consumer;
         this.dynamicLoadFactor = dynamicExtraLoadFactor;
+        this.wmbm = new WorkMailBoxManager<K, V>();
     }
 
     /**
@@ -207,42 +213,20 @@ public void registerWork(List<ConsumerRecords<K, V>> records) {
         }
     }
 
-    /**
-     * Work must be registered in offset order
-     * <p>
-     * Thread safe for use by control and broker poller thread.
-     *
-     * @see #success
-     * @see #raisePartitionHighWaterMark
-     */
     public void registerWork(ConsumerRecords<K, V> records) {
-        workInbox.add(records);
+        wmbm.registerWork(records);
     }
 
-    private final Queue<ConsumerRecords<K, V>> internalBatchMailQueue = new LinkedList<>();
-    private final Queue<ConsumerRecord<K, V>> internalFlattenedMailQueue = new LinkedList<>();
-
-    /**
-     * Take our inbound messages from the {@link BrokerPollSystem} and add them to our registry.
-     *
-     * @param requestedMaxWorkToRetrieve
-     */
     private void processInbox(final int requestedMaxWorkToRetrieve) {
-        workInbox.drainTo(internalBatchMailQueue);
-
-        // flatten
-        while (!internalBatchMailQueue.isEmpty()) {
-            ConsumerRecords<K, V> consumerRecords = internalBatchMailQueue.poll();
-            log.debug("Flattening {} records", consumerRecords.count());
-            for (final ConsumerRecord<K, V> consumerRecord : consumerRecords) {
-                internalFlattenedMailQueue.add(consumerRecord);
-            }
-        }
+        wmbm.processInbox(requestedMaxWorkToRetrieve);
 
         int gap = requestedMaxWorkToRetrieve;
         int taken = 0;
 
-        log.debug("Will attempt to register the requested {} - {} available", requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
+        Queue<ConsumerRecord<K, V>> internalFlattenedMailQueue = wmbm.getInternalFlattenedMailQueue();
+
+        log.debug("Will attempt to register the requested {} - {} available in internal mailbox",
+                requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
 
         //
         while (taken < gap && !internalFlattenedMailQueue.isEmpty()) {
@@ -324,7 +308,8 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
         // todo this counts all partitions as a whole - this may cause some partitions to starve. need to round robin it?
         int available = getWorkQueuedInShardsCount();
         int extraNeededFromInboxToSatisfy = requestedMaxWorkToRetrieve - available;
-        log.debug("Requested: {}, available: {}, will try retrieve from mailbox the delta of: {}", requestedMaxWorkToRetrieve, available, extraNeededFromInboxToSatisfy);
+        log.debug("Requested: {}, available in shards: {}, will try retrieve from mailbox the delta of: {}",
+                requestedMaxWorkToRetrieve, available, extraNeededFromInboxToSatisfy);
         processInbox(extraNeededFromInboxToSatisfy);
 
         //
@@ -361,8 +346,13 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
                     wc.takingAsWork();
                     shardWork.add(wc);
                 } else {
-                    log.trace("Work ({}) still delayed ({}) or is in flight ({}, time in flight: {}), alreadySucceeded? {} can't take...",
-                            wc, !wc.hasDelayPassed(clock), !wc.isNotInFlight(), wc.getTimeInFlight(), alreadySucceeded);
+                    Duration timeInFlight = wc.getTimeInFlight();
+                    Level level = Level.TRACE;
+                    if (timeInFlight.toSeconds() > 1) {
+                        level = Level.WARN;
+                    }
+                    at(log, level).log("Work ({}) still delayed ({}) or is in flight ({}, time in flight: {}), alreadySucceeded? {} can't take...",
+                            wc, !wc.hasDelayPassed(clock), !wc.isNotInFlight(), timeInFlight, alreadySucceeded);
                 }
 
                 ProcessingOrder ordering = options.getOrdering();
@@ -438,25 +428,8 @@ public int getTotalWorkWaitingProcessing() {
         return getWorkQueuedInShardsCount() + getWorkQueuedInMailboxCount();
     }
 
-    /**
-     * TODO use a cache of this information, readable from a seperate thread
-     *
-     * @return amount of work queued in the mail box, awaiting processing into shards
-     */
     Integer getWorkQueuedInMailboxCount() {
-        int batchCount = 0;
-        for (final ConsumerRecords<K, V> inboxEntry : workInbox) {
-            batchCount += inboxEntry.count();
-        }
-        if (internalBatchMailQueue.size() > 10) {
-            log.warn("Larger than expected {}", internalBatchMailQueue.size());
-        }
-        for (final ConsumerRecords<K, V> consumerRecords : new ArrayList<>(internalBatchMailQueue)) { // TODO copy for concurrent access - as it holds batches of polled records, it should be relatively small
-            if (consumerRecords != null) {
-                batchCount += consumerRecords.count();
-            }
-        }
-        return batchCount + internalFlattenedMailQueue.size();
+        return wmbm.getWorkQueuedInMailboxCount();
     }
 
     /**
@@ -472,7 +445,8 @@ public int getWorkQueuedInShardsCount() {
 
     boolean isRecordsAwaitingProcessing() {
         int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
-        return partitionWorkRemainingCount > 0 || !internalBatchMailQueue.isEmpty() || !internalFlattenedMailQueue.isEmpty();
+        boolean internalQueuesNotEmpty = hasWorkInMailboxes();
+        return partitionWorkRemainingCount > 0 || internalQueuesNotEmpty;
     }
 
     boolean isRecordsAwaitingToBeCommitted() {
@@ -516,6 +490,7 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
             count += partitionQueue.size();
             var workToRemove = new LinkedList<WorkContainer<K, V>>();
             var incompleteOffsets = new LinkedHashSet<Long>();
+            long lowWaterMark = -1;
             // can't commit this offset or beyond, as this is the latest offset that is incomplete
             // i.e. only commit offsets that come before the current one, and stop looking for more
             boolean iteratedBeyondLowWaterMarkBeingLowestCommittableOffset = false;
@@ -535,8 +510,8 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
                         offsetsToSend.put(topicPartitionKey, offsetData);
                     } else if (container.getUserFunctionSucceeded().get() && iteratedBeyondLowWaterMarkBeingLowestCommittableOffset) {
                         // todo lookup the low water mark and include here
-                        log.trace("Offset {} is complete and succeeded, but we've iterated past the lowest committable offset. Will mark as complete in the offset map.",
-                                container.getCr().offset());
+                        log.trace("Offset {} is complete and succeeded, but we've iterated past the lowest committable offset ({}). Will mark as complete in the offset map.",
+                                container.getCr().offset(), lowWaterMark);
                         // no-op - offset map is only for not succeeded or completed offsets
 //                        // mark as complete complete so remove from work
 //                        workToRemove.add(container);
@@ -546,6 +521,7 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
                         incompleteOffsets.add(offset);
                     }
                 } else {
+                    lowWaterMark = container.offset();
                     iteratedBeyondLowWaterMarkBeingLowestCommittableOffset = true;
                     log.trace("Offset ({}) is incomplete, holding up the queue ({}) of size {}.",
                             container.getCr().offset(),
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index 5fb81cb16..c2cce9fc8 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -25,6 +25,7 @@
 import org.assertj.core.api.Assertions;
 import org.assertj.core.api.SoftAssertions;
 import org.awaitility.core.ConditionTimeoutException;
+import org.awaitility.core.TerminalFailureException;
 import org.junit.jupiter.api.RepeatedTest;
 import org.junit.jupiter.api.Test;
 import org.junitpioneer.jupiter.CartesianProductTest;
@@ -35,6 +36,7 @@
 import java.util.stream.Collectors;
 import java.util.stream.IntStream;
 
+import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.*;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
@@ -175,26 +177,37 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
         Assertions.useRepresentation(new TrimListRepresentation());
 
         // todo rounds should be 1? progress should always be made
-        int roundsAllowed = 1;
-        if (commitMode.equals(CONSUMER_SYNC)) {
-            roundsAllowed = 2; // sync consumer commits can take time // fails
-//            roundsAllowed = 5; // sync consumer commits can take time // fails
-//            roundsAllowed = 10; // sync consumer commits can take time // fails
-//            roundsAllowed = 12; // sync consumer commits can take time // // works with no logging
-        }
+        int roundsAllowed = 10;
+//        if (commitMode.equals(CONSUMER_SYNC)) {
+//            roundsAllowed = 3; // sync consumer commits can take time // fails
+////            roundsAllowed = 5; // sync consumer commits can take time // fails
+////            roundsAllowed = 10; // sync consumer commits can take time // fails
+////            roundsAllowed = 12; // sync consumer commits can take time // // works with no logging
+//        }
 
         ProgressTracker pt = new ProgressTracker(processedCount, roundsAllowed);
-        var failureMessage = StringUtils.msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
+        var failureMessage = msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
-            waitAtMost(ofSeconds(20)).alias(failureMessage).untilAsserted(() -> {
-                log.info("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
-                pt.checkForProgressExceptionally();
-                SoftAssertions all = new SoftAssertions();
-                all.assertThat(new ArrayList<>(consumedKeys)).as("all expected are consumed").hasSameSizeAs(expectedKeys);
-                all.assertThat(new ArrayList<>(producedKeysAcknowledged)).as("all consumed are produced ok ").hasSameSizeAs(expectedKeys);
-                all.assertAll();
-            });
+            waitAtMost(ofSeconds(200))
+                    .failFast(() -> pc.isClosedOrFailed()
+                                    || producedCount.get() > expectedMessageCount,
+                            () -> {
+                                if (pc.isClosedOrFailed())
+                                    return pc.getFailureCause();
+                                else
+                                    return new TerminalFailureException(msg("Too many messages? processedCount.get() {} > expectedMessageCount {}",
+                                            producedCount.get(), expectedMessageCount)); // needs fail-fast feature in 4.0.4 // TODO link
+                            })
+                    .alias(failureMessage)
+                    .untilAsserted(() -> {
+                        log.info("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
+                        pt.checkForProgressExceptionally();
+                        SoftAssertions all = new SoftAssertions();
+                        all.assertThat(new ArrayList<>(consumedKeys)).as("all expected are consumed").hasSameSizeAs(expectedKeys);
+                        all.assertThat(new ArrayList<>(producedKeysAcknowledged)).as("all consumed are produced ok ").hasSameSizeAs(expectedKeys);
+                        all.assertAll();
+                    });
         } catch (ConditionTimeoutException e) {
             log.debug("Expected keys (size {})", expectedKeys.size());
             log.debug("Consumed keys ack'd (size {})", consumedKeys.size());
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 63dd8b802..c9a39f8c8 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -27,7 +27,7 @@
 
     <!-- primary -->
     <logger name="io.confluent.parallelconsumer" level="info"/>
-    <logger name="io.confluent.parallelconsumer" level="debug"/>
+<!--    <logger name="io.confluent.parallelconsumer" level="debug"/>-->
 <!--        <logger name="io.confluent.parallelconsumer" level="trace"/>-->
 <!--            <logger name="io.confluent.parallelconsumer.ParallelEoSStreamProcessor" level="trace"/>-->
 <!--        <logger name="io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest" level="info"/> &lt;!&ndash; docker logs &ndash;&gt;-->
@@ -38,10 +38,10 @@
     <!--            <logger name="io.confluent.parallelconsumer" level="trace" />-->
 
     <!-- notable specifics -->
-    <logger name="io.confluent.parallelconsumer.integrationTests" level="debug"/>
+<!--    <logger name="io.confluent.parallelconsumer.integrationTests" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.integrationTests.LargeVolumeInMemoryTests" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.ParallelConsumerTestBase" level="trace"/>-->
-    <!--    <logger name="io.confluent.parallelconsumer.WorkManager" level="trace" />-->
+        <logger name="io.confluent.parallelconsumer.WorkManager" level="trace" />
     <!--    <logger name="io.confluent.parallelconsumer.ParallelConsumer" level="info" />-->
     <!--    <logger name="io.confluent.parallelconsumer.OffsetMapCodecManager" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.WorkManagerOffsetMapCodecManagerTest" level="debug"/>-->

From 1edcdafe318ee4d4f410bafff9acb4d2f7cf8281 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 09:58:42 +0000
Subject: [PATCH 010/131] More

---
 .../ParallelEoSStreamProcessor.java           | 11 +++--
 .../parallelconsumer/ProducerManager.java     |  2 +-
 .../parallelconsumer/WorkContainer.java       |  4 ++
 .../parallelconsumer/WorkManager.java         | 19 +++++++-
 .../TransactionAndCommitModeTest.java         | 45 ++++++++++++++-----
 .../confluent/csid/utils/ProgressTracker.java | 18 +++++++-
 .../src/test/resources/logback-test.xml       |  2 +-
 pom.xml                                       |  2 +-
 8 files changed, 84 insertions(+), 19 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 524c1af4c..8f6abf877 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -650,8 +650,11 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
             log.trace("Woke up", e);
         }
 
-        if (getWorkerQueueSize() == 0 && wm.getTotalWorkWaitingProcessing() > 0 && newWork == 0) {
-            log.error("No work to do, yet messages waiting in shard queue");
+        // todo remove
+        if (log.isDebugEnabled()) {
+            if (getWorkerQueueSize() == 0 && wm.getTotalWorkWaitingProcessing() > 0 && newWork == 0) {
+                log.error("No work to do, yet messages waiting in shard queue. active count: {}", workerPool.getActiveCount());
+            }
         }
 
         // end of loop
@@ -769,7 +772,7 @@ private void processWorkCompleteMailBox() {
         Set<WorkContainer<K, V>> results = new HashSet<>();
         final Duration timeout = getTimeToNextCommit(); // don't sleep longer than when we're expected to maybe commit
 
-        boolean nothingInFlight = !wm.hasWorkInFlight();
+//        boolean nothingInFlight = !wm.hasWorkInFlight();
 //        if (nothingInFlight && wm.hasWorkInMailboxes()) {
 //        boolean willNeverReceiveWork = getWorkerQueueSize() < 1 && workerPool.getActiveCount() == 0;
 //        if (willNeverReceiveWork && workMailBox.isEmpty() && numberOfAssignedPartitions > 0) {
@@ -980,7 +983,7 @@ protected <R> List<Tuple<ConsumerRecord<K, V>, R>> userFunctionRunner(Function<C
             return intermediateResults;
         } catch (Exception e) {
             // handle fail
-            log.debug("Error processing record", e);
+            log.error("Error processing record", e);
             wc.onUserFunctionFailure();
             addToMailbox(wc); // always add on error
             throw e; // trow again to make the future failed
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
index 6ec0d3450..5f09414ed 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ProducerManager.java
@@ -42,7 +42,7 @@ public class ProducerManager<K, V> extends AbstractOffsetCommitter<K, V> impleme
     private Field txManagerField;
     private Method txManagerMethodIsCompleting;
     private Method txManagerMethodIsReady;
-    private final long sendTimeoutSeconds = 1L;
+    private final long sendTimeoutSeconds = 2L;
 
     public ProducerManager(final Producer<K, V> newProducer, final ConsumerManager<K, V> newConsumer, final WorkManager<K, V> wm, ParallelConsumerOptions options) {
         super(newConsumer, wm);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
index c7cfff49b..7498ae55f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
@@ -109,6 +109,10 @@ public boolean isNotInFlight() {
         return !inFlight;
     }
 
+    public boolean isInFlight() {
+        return inFlight;
+    }
+
     public void takingAsWork() {
         log.trace("Being taken as work: {}", this);
         inFlight = true;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index 2618eebb5..6d3dd0ef4 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -75,7 +75,7 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
 
     private final DynamicLoadFactor dynamicLoadFactor;
 
-    private final WorkMailBoxManager<K ,V> wmbm;
+    private final WorkMailBoxManager<K, V> wmbm;
 
     /**
      * Iteration resume point, to ensure fairness (prevent shard starvation) when we can't process messages from every
@@ -369,12 +369,29 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
             work.addAll(shardWork);
         }
 
+        checkShardsForProgress();
+
         log.debug("Got {} records of work. In-flight: {}, Awaiting in commit queues: {}", work.size(), getRecordsOutForProcessing(), getNumberOfEntriesInPartitionQueues());
         recordsOutForProcessing += work.size();
 
         return work;
     }
 
+    // todo slooooow
+    // todo refactor to partition state
+    private void checkShardsForProgress() {
+        for (var shard : processingShards.entrySet()) {
+            for (final Map.Entry<Long, WorkContainer<K, V>> entry : shard.getValue().entrySet()) {
+                WorkContainer<K, V> work = entry.getValue();
+                long seconds = work.getTimeInFlight().toSeconds();
+                if (work.isInFlight() && seconds > 1) {
+                    log.warn("Work taking too long {} s : {}", seconds, entry);
+                }
+            }
+        }
+
+    }
+
     public void success(WorkContainer<K, V> wc) {
         workStateIsDirtyNeedsCommitting.set(true);
         ConsumerRecord<K, V> cr = wc.getCr();
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index c2cce9fc8..c2be2d199 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -38,8 +38,7 @@
 
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.*;
-import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
-import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.*;
 import static java.time.Duration.ofSeconds;
 import static org.assertj.core.api.Assertions.*;
 import static org.awaitility.Awaitility.waitAtMost;
@@ -72,7 +71,10 @@ public class TransactionAndCommitModeTest extends BrokerIntegrationTest<String,
     // default
     @CartesianProductTest(factory = "enumSets")
     void testDefaultMaxPoll(CommitMode commitMode, ProcessingOrder order) {
-        runTest(DEFAULT_MAX_POLL_RECORDS_CONFIG, commitMode, order);
+        int numMessages = 5000;
+        if (order.equals(PARTITION))
+            numMessages = 1000; // much slower
+        runTest(DEFAULT_MAX_POLL_RECORDS_CONFIG, commitMode, order, numMessages);
     }
 
     @Test
@@ -94,25 +96,39 @@ public void testTransactionalDefaultMaxPoll() {
     // low
     @CartesianProductTest(factory = "enumSets")
     public void testLowMaxPoll(CommitMode commitMode, ProcessingOrder order) {
-        runTest(LOW_MAX_POLL_RECORDS_CONFIG, commitMode, order);
+        int numMessages = 5000;
+        if (order.equals(PARTITION))
+            numMessages = 1000; // much slower
+        runTest(LOW_MAX_POLL_RECORDS_CONFIG, commitMode, order, numMessages);
     }
 
     // high counts
     @CartesianProductTest(factory = "enumSets")
     public void testHighMaxPollEnum(CommitMode commitMode, ProcessingOrder order) {
-        runTest(HIGH_MAX_POLL_RECORDS_CONFIG, commitMode, order);
+        int numMessages = 10000;
+        if (order.equals(PARTITION))
+            numMessages = 1000; // much slower
+
+        runTest(HIGH_MAX_POLL_RECORDS_CONFIG, commitMode, order, numMessages);
     }
 
-    @SneakyThrows
     private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order) {
+        //        int expectedMessageCount = 50_000;
+        int expectedMessageCount = 10_000;
+//        int expectedMessageCount = 10_000;
+//        int expectedMessageCount = 1_000;
+        runTest(maxPoll, commitMode, order, expectedMessageCount);
+    }
+
+    @SneakyThrows
+    private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order, int expectedCount) {
         String inputName = setupTopic(this.getClass().getSimpleName() + "-input-" + RandomUtils.nextInt());
         String outputName = setupTopic(this.getClass().getSimpleName() + "-output-" + RandomUtils.nextInt());
 
+        int expectedMessageCount = expectedCount;
+
         // pre-produce messages to input-topic
         List<String> expectedKeys = new ArrayList<>();
-        int expectedMessageCount = 50_000;
-//        int expectedMessageCount = 10_000;
-//        int expectedMessageCount = 1_000;
         log.info("Producing {} messages before starting test", expectedMessageCount);
         List<Future<RecordMetadata>> sends = new ArrayList<>();
         try (Producer<String, String> kafkaProducer = kcu.createNewProducer(false)) {
@@ -143,6 +159,8 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
         consumerProps.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, maxPoll);
         KafkaConsumer<String, String> newConsumer = kcu.createNewConsumer(true, consumerProps);
 
+        int numThreads = 16;
+//        int numThreads = 1000;
         var pc = new ParallelEoSStreamProcessor<String, String>(ParallelConsumerOptions.<String, String>builder()
                 .ordering(order)
                 .consumer(newConsumer)
@@ -151,6 +169,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 //                .numberOfThreads(1000)
 //                .numberOfThreads(100)
 //                .numberOfThreads(2)
+                .numberOfThreads(numThreads)
                 .build());
         pc.subscribe(of(inputName));
 
@@ -178,6 +197,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
         // todo rounds should be 1? progress should always be made
         int roundsAllowed = 10;
+//        roundsAllowed = 200;
 //        if (commitMode.equals(CONSUMER_SYNC)) {
 //            roundsAllowed = 3; // sync consumer commits can take time // fails
 ////            roundsAllowed = 5; // sync consumer commits can take time // fails
@@ -189,7 +209,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
         var failureMessage = msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
-            waitAtMost(ofSeconds(200))
+            waitAtMost(ofSeconds(2000))
                     .failFast(() -> pc.isClosedOrFailed()
                                     || producedCount.get() > expectedMessageCount,
                             () -> {
@@ -202,6 +222,10 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                     .alias(failureMessage)
                     .untilAsserted(() -> {
                         log.info("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
+                        int delta = producedCount.get() - processedCount.get();
+                        if (delta == numThreads && pt.getRounds().get() > 1) {
+                            log.error("Here we go fishy...");
+                        }
                         pt.checkForProgressExceptionally();
                         SoftAssertions all = new SoftAssertions();
                         all.assertThat(new ArrayList<>(consumedKeys)).as("all expected are consumed").hasSameSizeAs(expectedKeys);
@@ -226,6 +250,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
         // sanity
         assertThat(expectedMessageCount).isEqualTo(processedCount.get());
         assertThat(producedKeysAcknowledged).hasSameSizeAs(expectedKeys);
+        assertThat(pt.getHighestRoundCountSeen()).isLessThan(10);
     }
 
     @Test
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
index 9d32d8a8f..cb89b4ab2 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ProgressTracker.java
@@ -1,6 +1,7 @@
 package io.confluent.csid.utils;
 
 import io.confluent.parallelconsumer.InternalRuntimeError;
+import lombok.Getter;
 import lombok.RequiredArgsConstructor;
 
 import java.util.concurrent.atomic.AtomicInteger;
@@ -11,12 +12,21 @@
 public class ProgressTracker {
 
     public static final int WARMED_UP_AFTER_X_MESSAGES = 50;
+
     private final AtomicInteger processedCount;
+
     private final AtomicInteger lastSeen = new AtomicInteger(0);
+
+    @Getter
     private final AtomicInteger rounds = new AtomicInteger(0);
+
     private int roundsAllowed = 3;
+
     private int coldRoundsAllowed = 20;
 
+    @Getter
+    private int highestRoundCountSeen = 0;
+
     public ProgressTracker(final AtomicInteger processedCount, int roundsAllowed) {
         this.processedCount = processedCount;
         this.roundsAllowed = roundsAllowed;
@@ -34,13 +44,19 @@ public boolean hasProgressNotBeenMade() {
         } else if (!warmedUp && rounds.get() > coldRoundsAllowed) {
             return true;
         } else if (progress) {
-            rounds.set(0);
+            reset();
         }
         lastSeen.set(processedCount.get());
         rounds.incrementAndGet();
         return false;
     }
 
+    private void reset() {
+        if (rounds.get() > highestRoundCountSeen)
+            highestRoundCountSeen = rounds.get();
+        rounds.set(0);
+    }
+
     /**
      * @throws Exception If no progress is made
      */
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index c9a39f8c8..dc07ac03c 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -41,7 +41,7 @@
 <!--    <logger name="io.confluent.parallelconsumer.integrationTests" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.integrationTests.LargeVolumeInMemoryTests" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.ParallelConsumerTestBase" level="trace"/>-->
-        <logger name="io.confluent.parallelconsumer.WorkManager" level="trace" />
+<!--        <logger name="io.confluent.parallelconsumer.WorkManager" level="trace" />-->
     <!--    <logger name="io.confluent.parallelconsumer.ParallelConsumer" level="info" />-->
     <!--    <logger name="io.confluent.parallelconsumer.OffsetMapCodecManager" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.WorkManagerOffsetMapCodecManagerTest" level="debug"/>-->
diff --git a/pom.xml b/pom.xml
index 6080e16d1..551bd47e5 100644
--- a/pom.xml
+++ b/pom.xml
@@ -328,7 +328,7 @@
             <dependency>
                 <groupId>org.awaitility</groupId>
                 <artifactId>awaitility</artifactId>
-                <version>4.0.3</version>
+                <version>4.0.4-SNAPSHOT</version>
                 <scope>test</scope>
             </dependency>
             <dependency>

From b9a3962fcb43988e63635828b177658256ea6fdc Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 13:13:44 +0000
Subject: [PATCH 011/131] Only not-skipped work counts as pressure

---
 .../OffsetMapCodecManager.java                |  34 ++++--
 .../parallelconsumer/WorkManager.java         |  20 +--
 .../CloseAndOpenOffsetTest.java               | 115 ++++++++++--------
 .../WorkManagerOffsetMapCodecManagerTest.java |  14 +--
 4 files changed, 106 insertions(+), 77 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java
index 28e3ec934..ff478f93b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java
@@ -4,7 +4,7 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
-import lombok.SneakyThrows;
+import lombok.Value;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
@@ -12,7 +12,6 @@
 
 import java.nio.ByteBuffer;
 import java.nio.charset.Charset;
-import java.nio.charset.StandardCharsets;
 import java.util.*;
 
 import static io.confluent.csid.utils.Range.range;
@@ -51,6 +50,16 @@ public class OffsetMapCodecManager<K, V> {
 
     org.apache.kafka.clients.consumer.Consumer<K, V> consumer;
 
+    @Value
+    static class NextOffsetAndIncompletes {
+        long nextExpectedOffset;
+        Set<Long> incompleteOffsets;
+
+        public static NextOffsetAndIncompletes of(long nextExpectedOffset, Set<Long> incompleteOffsets){
+            return new NextOffsetAndIncompletes(nextExpectedOffset, incompleteOffsets);
+        }
+    }
+
     /**
      * Forces the use of a specific codec, instead of choosing the most efficient one. Useful for testing.
      */
@@ -88,22 +97,22 @@ void loadOffsetMapForPartition(final Set<TopicPartition> assignment) {
         });
     }
 
-    static ParallelConsumer.Tuple<Long, TreeSet<Long>> deserialiseIncompleteOffsetMapFromBase64(long finalBaseComittedOffsetForPartition, String incompleteOffsetMap) throws OffsetDecodingError {
+    static NextOffsetAndIncompletes deserialiseIncompleteOffsetMapFromBase64(long finalBaseComittedOffsetForPartition, String incompleteOffsetMap) throws OffsetDecodingError {
         byte[] decodedBytes;
         try {
             decodedBytes = OffsetSimpleSerialisation.decodeBase64(incompleteOffsetMap);
         } catch (IllegalArgumentException a) {
             throw new OffsetDecodingError(msg("Error decoding offset metadata, input was: {}", incompleteOffsetMap), a);
         }
-        ParallelConsumer.Tuple<Long, Set<Long>> incompleteOffsets = decodeCompressedOffsets(finalBaseComittedOffsetForPartition, decodedBytes);
-        TreeSet<Long> longs = new TreeSet<>(incompleteOffsets.getRight());
-        return ParallelConsumer.Tuple.pairOf(incompleteOffsets.getLeft(), longs);
+        return decodeCompressedOffsets(finalBaseComittedOffsetForPartition, decodedBytes);
     }
 
     void loadOffsetMetadataPayload(long startOffset, TopicPartition tp, String offsetMetadataPayload) throws OffsetDecodingError {
-        ParallelConsumer.Tuple<Long, TreeSet<Long>> incompletes = deserialiseIncompleteOffsetMapFromBase64(startOffset, offsetMetadataPayload);
-        wm.raisePartitionHighWaterMark(incompletes.getLeft(), tp);
-        wm.partitionIncompleteOffsets.put(tp, incompletes.getRight());
+        NextOffsetAndIncompletes incompletes = deserialiseIncompleteOffsetMapFromBase64(startOffset, offsetMetadataPayload);
+        wm.raisePartitionHighWaterMark(incompletes.getNextExpectedOffset(), tp);
+        Set<Long> incompleteOffsets = incompletes.getIncompleteOffsets();
+        wm.partitionIncompleteOffsets.put(tp, incompleteOffsets);
+        log.warn("Loaded incomplete offsets from offset metadata {}", incompleteOffsets);
     }
 
     String makeOffsetMetadataPayload(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) throws EncodingNotSupportedException {
@@ -147,10 +156,10 @@ byte[] encodeOffsetsCompressed(long finalOffsetForPartition, TopicPartition tp,
      *
      * @return Set of offsets which are not complete.
      */
-    static ParallelConsumer.Tuple<Long, Set<Long>> decodeCompressedOffsets(long finalOffsetForPartition, byte[] decodedBytes) {
+    static NextOffsetAndIncompletes decodeCompressedOffsets(long finalOffsetForPartition, byte[] decodedBytes) {
         if (decodedBytes.length == 0) {
             // no offset bitmap data
-            return ParallelConsumer.Tuple.pairOf(finalOffsetForPartition, UniSets.of());
+            return NextOffsetAndIncompletes.of(finalOffsetForPartition, UniSets.of());
         }
 
         EncodedOffsetPair result = EncodedOffsetPair.unwrap(decodedBytes);
@@ -160,8 +169,7 @@ static ParallelConsumer.Tuple<Long, Set<Long>> decodeCompressedOffsets(long fina
         Set<Long> incompletes = incompletesTuple.getRight();
         long highWater = incompletesTuple.getLeft();
 
-        ParallelConsumer.Tuple<Long, Set<Long>> tuple = ParallelConsumer.Tuple.pairOf(highWater, incompletes);
-        return tuple;
+        return NextOffsetAndIncompletes.of(highWater, incompletes);
     }
 
     String incompletesToBitmapString(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index 6d3dd0ef4..ae15b8d95 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -4,7 +4,6 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
-import io.confluent.csid.utils.LogUtils;
 import io.confluent.csid.utils.LoopingResumingIterator;
 import io.confluent.csid.utils.WallClock;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
@@ -24,7 +23,6 @@
 import java.util.*;
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.concurrent.ConcurrentSkipListMap;
-import java.util.concurrent.LinkedBlockingQueue;
 import java.util.concurrent.atomic.AtomicBoolean;
 import java.util.function.Consumer;
 
@@ -100,7 +98,7 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     /**
      * Offsets, which have been seen, beyond the highest committable offset, which haven't been totally completed
      */
-    Map<TopicPartition, TreeSet<Long>> partitionIncompleteOffsets = new HashMap<>();
+    Map<TopicPartition, Set<Long>> partitionIncompleteOffsets = new HashMap<>();
 
     // visible for testing
     /**
@@ -231,17 +229,23 @@ private void processInbox(final int requestedMaxWorkToRetrieve) {
         //
         while (taken < gap && !internalFlattenedMailQueue.isEmpty()) {
             ConsumerRecord<K, V> poll = internalFlattenedMailQueue.poll();
-            processInbox(poll);
-            taken++;
+            boolean takenAsWork = processInbox(poll);
+            if (takenAsWork) {
+                taken++;
+            }
         }
 
         log.debug("{} new records were registered.", taken);
 
     }
 
-    private void processInbox(final ConsumerRecord<K, V> rec) {
+    /**
+     * @return true if the record was taken, false if it was skipped (previously successful)
+     */
+    private boolean processInbox(final ConsumerRecord<K, V> rec) {
         if (isRecordPreviouslyProcessed(rec)) {
             log.trace("Record previously processed, skipping. offset: {}", rec.offset());
+            return false;
         } else {
             Object shardKey = computeShardKey(rec);
             long offset = rec.offset();
@@ -253,6 +257,8 @@ private void processInbox(final ConsumerRecord<K, V> rec) {
             processingShards.computeIfAbsent(shardKey, (ignore) -> new ConcurrentSkipListMap<>()).put(offset, wc);
 
             partitionCommitQueues.computeIfAbsent(tp, (ignore) -> new ConcurrentSkipListMap<>()).put(offset, wc);
+
+            return true;
         }
     }
 
@@ -267,7 +273,7 @@ void raisePartitionHighWaterMark(long highWater, TopicPartition tp) {
     private boolean isRecordPreviouslyProcessed(ConsumerRecord<K, V> rec) {
         long offset = rec.offset();
         TopicPartition tp = new TopicPartition(rec.topic(), rec.partition());
-        TreeSet<Long> incompleteOffsets = this.partitionIncompleteOffsets.getOrDefault(tp, new TreeSet<>());
+        Set<Long> incompleteOffsets = this.partitionIncompleteOffsets.getOrDefault(tp, new TreeSet<>());
         if (incompleteOffsets.contains(offset)) {
             // record previously saved as having not been processed
             return false;
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
index 49e05aaba..ce17c9bec 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
@@ -37,6 +37,9 @@
 import static org.awaitility.Awaitility.await;
 
 /**
+ * Series of tests that check when we close a PC with incompletes encoded, when we open a new one, the correct messages
+ * are skipped.
+ *
  * @see OffsetMapCodecManager
  */
 @Timeout(value = 60)
@@ -176,8 +179,8 @@ private void send(int quantity, String topic, int partition) throws InterruptedE
         log.debug("Sending {} messages to {}", quantity, topic);
         var futures = new ArrayList<Future<RecordMetadata>>();
         // async
-        for (Integer i : Range.range(quantity)) {
-            Future<RecordMetadata> send = kcu.producer.send(new ProducerRecord<>(topic, partition, i.toString(), i.toString()));
+        for (Integer index : Range.range(quantity)) {
+            Future<RecordMetadata> send = kcu.producer.send(new ProducerRecord<>(topic, partition, index.toString(), index.toString()));
             futures.add(send);
         }
         // block until finished
@@ -273,67 +276,79 @@ void largeNumberOfMessagesSmallOffsetBitmap() {
                 .isLessThanOrEqualTo(KafkaClientUtils.MAX_POLL_RECORDS);
         send(quantity, topic, 0);
 
-        KafkaConsumer<String, String> consumer = kcu.createNewConsumer();
-        KafkaProducer<String, String> producerOne = kcu.createNewProducer(true);
-        var options = ParallelConsumerOptions.<String, String>builder()
+        var baseOptions = ParallelConsumerOptions.<String, String>builder()
                 .ordering(UNORDERED)
-                .consumer(consumer)
-                .producer(producerOne)
                 .commitMode(TRANSACTIONAL_PRODUCER)
                 .build();
-        var asyncOne = new ParallelEoSStreamProcessor<String, String>(options);
-
-        asyncOne.subscribe(UniLists.of(topic));
 
         Set<String> failingMessages = UniSets.of("123", "2345", "8765");
-        var readByOne = new ConcurrentSkipListSet<String>();
-        asyncOne.poll(x -> {
-            String value = x.value();
-            if (failingMessages.contains(value)) {
-                log.info("Throwing fake error for message {}", value);
-                throw new RuntimeException("Message " + value);
-            }
-            readByOne.add(value);
-        });
-
-        // the single message is not processed
         int numberOfFailingMessages = failingMessages.size();
-        await().atMost(ofSeconds(10)).untilAsserted(() -> assertThat(readByOne.size())
-                .isEqualTo(quantity - numberOfFailingMessages));
 
-        //
-        // TODO: fatal vs retriable exceptions. Retry limits particularly for draining state?
-        asyncOne.closeDontDrainFirst();
+        // step 1
+        {
+            KafkaConsumer<String, String> consumer = kcu.createNewConsumer();
+            KafkaProducer<String, String> producerOne = kcu.createNewProducer(true);
+            var options = baseOptions.toBuilder()
+                    .consumer(consumer)
+                    .producer(producerOne)
+                    .build();
+            var asyncOne = new ParallelEoSStreamProcessor<String, String>(options);
 
-        //
-        kcu.props.put(ConsumerConfig.CLIENT_ID_CONFIG, "THREE-my-client");
-        KafkaConsumer<String, String> newConsumerThree = kcu.createNewConsumer();
-        KafkaProducer<String, String> producerThree = kcu.createNewProducer(true);
-        var optionsThree = options.toBuilder()
-                .consumer(newConsumerThree)
-                .producer(producerThree)
-                .build();
-        try (var asyncThree = new ParallelEoSStreamProcessor<String, String>(optionsThree)) {
-            asyncThree.subscribe(UniLists.of(topic));
+            asyncOne.subscribe(UniLists.of(topic));
 
-            // read what we're given
-            var readByThree = new ConcurrentSkipListSet<String>();
-            asyncThree.poll(x -> {
-                log.trace("Three read: {}", x.value());
-                readByThree.add(x.value());
+            var readByOne = new ConcurrentSkipListSet<String>();
+            asyncOne.poll(x -> {
+                String value = x.value();
+                if (failingMessages.contains(value)) {
+                    throw new RuntimeException("Fake error for message " + value);
+                }
+                readByOne.add(value);
             });
 
-            await().alias("Only the one remaining failing message should be submitted for processing")
-                    .pollDelay(ofSeconds(1))
-                    .atLeast(ofSeconds(1))
-                    .untilAsserted(() -> {
-                                assertThat(readByThree.size()).as("Contains only previously failed messages")
-                                        .isEqualTo(numberOfFailingMessages);
-                            }
-                    );
+            // the single message is not processed
+            await().atMost(ofSeconds(10)).untilAsserted(() -> assertThat(readByOne.size())
+                    .isEqualTo(quantity - numberOfFailingMessages));
 
             //
-            assertThat(readByThree).hasSize(numberOfFailingMessages); // double check after closing
+            // TODO: fatal vs retriable exceptions. Retry limits particularly for draining state?
+            asyncOne.closeDontDrainFirst();
+
+            // sanity - post close
+            assertThat(readByOne.size()).isEqualTo(quantity - numberOfFailingMessages);
+        }
+
+        // step 2
+        {
+            //
+            kcu.props.put(ConsumerConfig.CLIENT_ID_CONFIG, "THREE-my-client");
+            KafkaConsumer<String, String> newConsumerThree = kcu.createNewConsumer();
+            KafkaProducer<String, String> producerThree = kcu.createNewProducer(true);
+            var optionsThree = baseOptions.toBuilder()
+                    .consumer(newConsumerThree)
+                    .producer(producerThree)
+                    .build();
+            try (var asyncThree = new ParallelEoSStreamProcessor<String, String>(optionsThree)) {
+                asyncThree.subscribe(UniLists.of(topic));
+
+                // read what we're given
+                var readByThree = new ConcurrentSkipListSet<String>();
+                asyncThree.poll(x -> {
+                    log.info("Three read: {}", x.value());
+                    readByThree.add(x.value());
+                });
+
+                await().alias("Only the one remaining failing message should be submitted for processing")
+                        .pollDelay(ofSeconds(1))
+                        .atLeast(ofSeconds(1))
+                        .untilAsserted(() -> {
+                                    assertThat(readByThree.size()).as("Contains only previously failed messages")
+                                            .isEqualTo(numberOfFailingMessages);
+                                }
+                        );
+
+                //
+                assertThat(readByThree).hasSize(numberOfFailingMessages); // double check after closing
+            }
         }
     }
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java
index 2098d9efa..b141051f4 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java
@@ -110,7 +110,7 @@ void serialiseCycle() {
         log.info("Size: {}", serialised.length());
 
         //
-        Set<Long> longs = om.deserialiseIncompleteOffsetMapFromBase64(finalOffsetForPartition, serialised).getRight();
+        Set<Long> longs = om.deserialiseIncompleteOffsetMapFromBase64(finalOffsetForPartition, serialised).getIncompleteOffsets();
 
         //
         assertThat(longs.toArray()).containsExactly(incomplete.toArray());
@@ -213,8 +213,8 @@ void base64Encoding() {
     @Test
     void loadCompressedRunLengthEncoding() {
         byte[] bytes = om.encodeOffsetsCompressed(finalOffsetForPartition, tp, incomplete);
-        ParallelConsumer.Tuple<Long, Set<Long>> longs = om.decodeCompressedOffsets(finalOffsetForPartition, bytes);
-        assertThat(longs.getRight().toArray()).containsExactly(incomplete.toArray());
+        OffsetMapCodecManager.NextOffsetAndIncompletes longs = om.decodeCompressedOffsets(finalOffsetForPartition, bytes);
+        assertThat(longs.getIncompleteOffsets().toArray()).containsExactly(incomplete.toArray());
     }
 
     @Test
@@ -321,9 +321,9 @@ void deserialiseBitset() {
     void compressionCycle() {
         byte[] serialised = om.encodeOffsetsCompressed(finalOffsetForPartition, tp, incomplete);
 
-        ParallelConsumer.Tuple<Long, Set<Long>> deserialised = om.decodeCompressedOffsets(finalOffsetForPartition, serialised);
+        OffsetMapCodecManager.NextOffsetAndIncompletes deserialised = om.decodeCompressedOffsets(finalOffsetForPartition, serialised);
 
-        assertThat(deserialised.getRight()).isEqualTo(incomplete);
+        assertThat(deserialised.getIncompleteOffsets()).isEqualTo(incomplete);
     }
 
     @Test
@@ -355,8 +355,8 @@ void differentInputs() {
                 byte[] result = encoder.packEncoding(pair);
 
                 //
-                ParallelConsumer.Tuple<Long, Set<Long>> recoveredIncompleteOffsetTuple = om.decodeCompressedOffsets(finalOffsetForPartition, result);
-                Set<Long> recoveredIncompletes = recoveredIncompleteOffsetTuple.getRight();
+                OffsetMapCodecManager.NextOffsetAndIncompletes recoveredIncompleteOffsetTuple = om.decodeCompressedOffsets(finalOffsetForPartition, result);
+                Set<Long> recoveredIncompletes = recoveredIncompleteOffsetTuple.getIncompleteOffsets();
 
                 //
                 assertThat(recoveredIncompletes).containsExactlyInAnyOrderElementsOf(longs);

From 27e0c9ab421e70a44925f5b530537516909f6dd1 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 13:49:02 +0000
Subject: [PATCH 012/131] Fix nested counting, tests

---
 .../CountingCRLinkedList.java                 | 11 +++++++++-
 .../ParallelEoSStreamProcessor.java           |  2 +-
 .../parallelconsumer/WorkManager.java         | 21 +++++++++----------
 .../confluent/csid/utils/KafkaTestUtils.java  |  4 +++-
 .../ParallelEoSStreamProcessorTest.java       | 20 ++++++++++++++----
 5 files changed, 40 insertions(+), 18 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java
index 275c55a0e..460d18c1b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/CountingCRLinkedList.java
@@ -20,10 +20,19 @@ public void add(final int index, final ConsumerRecords<K, V> element) {
         super.add(index, element);
     }
 
+    @Override
+    public boolean add(final ConsumerRecords<K, V> element) {
+        nestedCount = nestedCount + element.count();
+        return super.add(element);
+    }
+
     @Override
     public ConsumerRecords<K, V> poll() {
         ConsumerRecords<K, V> poll = super.poll();
-        nestedCount = nestedCount - poll.count();
+        if (poll != null) {
+            int numberOfNestedMessages = poll.count();
+            nestedCount = nestedCount - numberOfNestedMessages;
+        }
         return poll;
     }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 8f6abf877..04acc4ccd 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -659,7 +659,7 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
 
         // end of loop
         log.trace("End of control loop, waiting processing {}, remaining in partition queues: {}, out for processing: {}. In state: {}",
-                wm.getTotalWorkWaitingProcessing(), wm.getNumberOfEntriesInPartitionQueues(), wm.getRecordsOutForProcessing(), state);
+                wm.getTotalWorkWaitingProcessing(), wm.getNumberOfEntriesInPartitionQueues(), wm.getNumberRecordsOutForProcessing(), state);
     }
 
     RateLimiter rateLimiter = new RateLimiter();
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index ae15b8d95..f2e5cb090 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -81,7 +81,8 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      */
     private Optional<Object> iterationResumePoint = Optional.empty();
 
-    private int recordsOutForProcessing = 0;
+    @Getter
+    private int numberRecordsOutForProcessing = 0;
 
     /**
      * Useful for testing
@@ -377,8 +378,8 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
 
         checkShardsForProgress();
 
-        log.debug("Got {} records of work. In-flight: {}, Awaiting in commit queues: {}", work.size(), getRecordsOutForProcessing(), getNumberOfEntriesInPartitionQueues());
-        recordsOutForProcessing += work.size();
+        log.debug("Got {} records of work. In-flight: {}, Awaiting in commit queues: {}", work.size(), getNumberRecordsOutForProcessing(), getNumberOfEntriesInPartitionQueues());
+        numberRecordsOutForProcessing += work.size();
 
         return work;
     }
@@ -415,7 +416,7 @@ public void success(WorkContainer<K, V> wc) {
             processingShards.remove(key);
         }
         successfulWorkListeners.forEach((c) -> c.accept(wc)); // notify listeners
-        recordsOutForProcessing--;
+        numberRecordsOutForProcessing--;
     }
 
     public void failed(WorkContainer<K, V> wc) {
@@ -433,7 +434,7 @@ private void putBack(WorkContainer<K, V> wc) {
         var shard = processingShards.get(key);
         long offset = wc.getCr().offset();
         shard.put(offset, wc);
-        recordsOutForProcessing--;
+        numberRecordsOutForProcessing--;
     }
 
     public int getNumberOfEntriesInPartitionQueues() {
@@ -448,7 +449,9 @@ public int getNumberOfEntriesInPartitionQueues() {
      * @return Work count in mailbox plus work added to the processing shards
      */
     public int getTotalWorkWaitingProcessing() {
-        return getWorkQueuedInShardsCount() + getWorkQueuedInMailboxCount();
+        int workQueuedInShardsCount = getWorkQueuedInShardsCount();
+        Integer workQueuedInMailboxCount = getWorkQueuedInMailboxCount();
+        return workQueuedInShardsCount + workQueuedInMailboxCount;
     }
 
     Integer getWorkQueuedInMailboxCount() {
@@ -674,10 +677,6 @@ private int getLoadingFactor() {
         return dynamicLoadFactor.getCurrentFactor();
     }
 
-    public int getRecordsOutForProcessing() {
-        return recordsOutForProcessing;
-    }
-
     // TODO effeciency issues
     public boolean workIsWaitingToBeCompletedSuccessfully() {
         Collection<NavigableMap<Long, WorkContainer<K, V>>> values = processingShards.values();
@@ -689,7 +688,7 @@ public boolean workIsWaitingToBeCompletedSuccessfully() {
     }
 
     public boolean hasWorkInFlight() {
-        return getRecordsOutForProcessing() != 0;
+        return getNumberRecordsOutForProcessing() != 0;
     }
 
     public boolean isClean() {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
index 309fa795d..fc5327c80 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
@@ -114,7 +114,9 @@ public static void assertCommitLists(MockProducer mp, List<List<Integer>> expect
      *
      * @see OffsetMapCodecManager
      */
-    public static void assertCommitLists(List<Map<String, Map<TopicPartition, OffsetAndMetadata>>> history, List<List<Integer>> expectedPartitionOffsets, Optional<String> description) {
+    public static void assertCommitLists(List<Map<String, Map<TopicPartition, OffsetAndMetadata>>> history,
+                                         List<List<Integer>> expectedPartitionOffsets,
+                                         Optional<String> description) {
         log.info("Asserting commits of {}", expectedPartitionOffsets);
 
         AtomicReference<String> topicName = new AtomicReference<>("");
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
index 4ac11be7a..b8400f5e6 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
@@ -32,6 +32,7 @@
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.CONSUMER_ASYNCHRONOUS;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.TRANSACTIONAL_PRODUCER;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.time.Duration.ofMillis;
 import static java.time.Duration.ofSeconds;
 import static java.util.concurrent.TimeUnit.SECONDS;
@@ -83,10 +84,16 @@ public void failingActionNothingCommitted(CommitMode commitMode) {
     @EnumSource(CommitMode.class)
     @SneakyThrows
     public void offsetsAreNeverCommittedForMessagesStillInFlightSimplest(CommitMode commitMode) {
-        setupParallelConsumerInstance(commitMode);
+        ParallelConsumerOptions options = getBaseOptions(commitMode).toBuilder()
+                .ordering(UNORDERED)
+                .build();
+        setupParallelConsumerInstance(options);
 
+        primeFirstRecord();
         sendSecondRecord(consumerSpy);
 
+        assertThat(parallelConsumer.getWm().getOptions().getOrdering()).isEqualTo(UNORDERED);
+
         var locks = constructLatches(2);
 
         var processedStates = new HashMap<Integer, Boolean>();
@@ -103,7 +110,9 @@ public void offsetsAreNeverCommittedForMessagesStillInFlightSimplest(CommitMode
 
         awaitLatch(startBarrierLatch);
 
-        assertThat(parallelConsumer.getWm().getRecordsOutForProcessing()).isEqualTo(2);
+        assertThat(parallelConsumer.getWm().getTotalWorkWaitingProcessing()).isEqualTo(2);
+
+        assertThat(parallelConsumer.getWm().getNumberRecordsOutForProcessing()).isEqualTo(2);
 
         // finish processing 1
         releaseAndWait(locks, 1);
@@ -235,11 +244,14 @@ public void offsetsAreNeverCommittedForMessagesStillInFlightLong(CommitMode comm
     @EnumSource(CommitMode.class)
     @SneakyThrows
     public void offsetCommitsAreIsolatedPerPartition(CommitMode commitMode) {
-        setupParallelConsumerInstance(commitMode);
+        setupParallelConsumerInstance(getBaseOptions(commitMode).toBuilder()
+                .ordering(UNORDERED)
+                .build());
+        primeFirstRecord();
 
         sendSecondRecord(consumerSpy);
 
-        // send three messages - 0,1, to one partition and 3,4 to another partition petitions
+        // send messages - 0,1, to one partition and 3,4 to another partition petitions
         consumerSpy.addRecord(ktu.makeRecord(1, "0", "v2"));
         consumerSpy.addRecord(ktu.makeRecord(1, "0", "v3"));
 

From 57bb482bdaabf955df0f016034fee052eb0a92f3 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 14:18:37 +0000
Subject: [PATCH 013/131] Squash Fix tests

---
 .../parallelconsumer/vertx/VertxParallelEoSStreamProcessor.java | 1 -
 .../parallelconsumer/vertx/VertxNonVertxOperations.java         | 2 +-
 2 files changed, 1 insertion(+), 2 deletions(-)

diff --git a/parallel-consumer-vertx/src/main/java/io/confluent/parallelconsumer/vertx/VertxParallelEoSStreamProcessor.java b/parallel-consumer-vertx/src/main/java/io/confluent/parallelconsumer/vertx/VertxParallelEoSStreamProcessor.java
index bf9df7dcb..23562bd29 100644
--- a/parallel-consumer-vertx/src/main/java/io/confluent/parallelconsumer/vertx/VertxParallelEoSStreamProcessor.java
+++ b/parallel-consumer-vertx/src/main/java/io/confluent/parallelconsumer/vertx/VertxParallelEoSStreamProcessor.java
@@ -233,7 +233,6 @@ private boolean isVertxWork(List<?> resultsFromUserFunction) {
     @Override
     public void close(Duration timeout, DrainingMode drainMode) {
         log.info("Vert.x async consumer closing...");
-        waitForProcessedNotCommitted(timeout);
         super.close(timeout, drainMode);
         webClient.close();
         Future<Void> close = vertx.close();
diff --git a/parallel-consumer-vertx/src/test/java/io/confluent/parallelconsumer/vertx/VertxNonVertxOperations.java b/parallel-consumer-vertx/src/test/java/io/confluent/parallelconsumer/vertx/VertxNonVertxOperations.java
index cf72d299f..3440b13eb 100644
--- a/parallel-consumer-vertx/src/test/java/io/confluent/parallelconsumer/vertx/VertxNonVertxOperations.java
+++ b/parallel-consumer-vertx/src/test/java/io/confluent/parallelconsumer/vertx/VertxNonVertxOperations.java
@@ -12,7 +12,7 @@
 import io.vertx.ext.web.client.WebClient;
 
 /**
- * Ensure all plain operations still work with the extended vertx consumer
+ * Ensure all plain operations from {@link ParallelEoSStreamProcessorTest} still work with the extended vertx consumer
  */
 public class VertxNonVertxOperations extends ParallelEoSStreamProcessorTest {
 

From 2ca242a7ec045e8a788ddb13f4bcdab41b3c5a6b Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 14:21:24 +0000
Subject: [PATCH 014/131] Fixes

---
 .../parallelconsumer/ConsumerManager.java         |  2 +-
 .../parallelconsumer/DynamicLoadFactor.java       |  2 +-
 .../ParallelEoSStreamProcessor.java               | 15 +++++++++++----
 .../confluent/parallelconsumer/WorkManager.java   |  7 +++++--
 4 files changed, 18 insertions(+), 8 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
index 73db6d86b..b690ebbe9 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
@@ -33,7 +33,7 @@ ConsumerRecords<K, V> poll(Duration requestedLongPollTimeout) {
         ConsumerRecords<K, V> records;
         try {
             if (commitRequested) {
-                log.warn("Commit requested, so will not long poll as need to perform the commit");
+                log.debug("Commit requested, so will not long poll as need to perform the commit");
                 timeoutToUse = Duration.ofMillis(1);// disable long poll, as commit needs performing
                 commitRequested = false;
             }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
index 2a986bd24..abb2adcb8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/DynamicLoadFactor.java
@@ -58,7 +58,7 @@ private synchronized boolean doStep(final long nowMs, final long myLastStep) {
             if (myLastStep == lastSteppedFactor) {
                 currentFactor = currentFactor + stepUpFactorBy;
                 long delta = currentFactor - myLastStep;
-                log.info("Stepped up load factor from {} to {}", myLastStep, currentFactor);
+                log.debug("Stepped up load factor by {} from {} to {}", delta, myLastStep, currentFactor);
                 lastSteppedFactor = currentFactor;
                 return true;
             } else {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 04acc4ccd..fab0bcc4b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -662,7 +662,14 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
                 wm.getTotalWorkWaitingProcessing(), wm.getNumberOfEntriesInPartitionQueues(), wm.getNumberRecordsOutForProcessing(), state);
     }
 
-    RateLimiter rateLimiter = new RateLimiter();
+    private RateLimiter rateLimiter = new RateLimiter();
+
+    /**
+     * Control for stepping loading factor - shouldn't step if work requests can't be fulfilled due to restrictions.
+     * (e.g. we may want 10, but maybe there's a single partition and we're in partition mode - stepping up won't
+     * help).
+     */
+    private boolean lastWorkRequestWasFulfilled = false;
 
     private <R> int handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFunction, final Consumer<R> callback) {
         // check queue pressure first before addressing it
@@ -680,6 +687,7 @@ private <R> int handleWork(final Function<ConsumerRecord<K, V>, List<R>> userFun
             log.debug("Loop: Get work - target: {}, current queue size: {}, requesting: {}, loading factor: {}", target, current, delta, dynamicExtraLoadFactor.getCurrentFactor());
             var records = wm.<R>maybeGetWork(delta);
             gotWorkCount = records.size();
+            lastWorkRequestWasFulfilled = gotWorkCount >= delta;
 
             log.trace("Loop: Submit to pool");
             submitWorkToPool(userFunction, callback, records);
@@ -701,7 +709,6 @@ private int getQueueTargetLoaded() {
 
     private void checkPressure() {
         boolean moreWorkInQueuesAvailableThatHaveNotBeenPulled = wm.getWorkQueuedInMailboxCount() > options.getNumberOfThreads();
-//        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver()) {
         if (log.isTraceEnabled())
             log.trace("Queue pressure check: (current size: {}, loaded target: {}, factor: {}) if (isPoolQueueLow() {} && dynamicExtraLoadFactor.isWarmUpPeriodOver() {} && moreWorkInQueuesAvailableThatHaveNotBeenPulled {}) {",
                     getWorkerQueueSize(),
@@ -710,10 +717,10 @@ private void checkPressure() {
                     isPoolQueueLow(),
                     dynamicExtraLoadFactor.isWarmUpPeriodOver(),
                     moreWorkInQueuesAvailableThatHaveNotBeenPulled);
-        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver() && moreWorkInQueuesAvailableThatHaveNotBeenPulled) {
+        if (isPoolQueueLow() && dynamicExtraLoadFactor.isWarmUpPeriodOver() && moreWorkInQueuesAvailableThatHaveNotBeenPulled && lastWorkRequestWasFulfilled) {
             boolean steppedUp = dynamicExtraLoadFactor.maybeStepUp();
             if (steppedUp) {
-                log.warn("isPoolQueueLow(): Executor pool queue is not loaded with enough work (queue: {} vs target: {}), stepped up loading factor to {}",
+                log.debug("isPoolQueueLow(): Executor pool queue is not loaded with enough work (queue: {} vs target: {}), stepped up loading factor to {}",
                         getWorkerQueueSize(), getPoolQueueTarget(), dynamicExtraLoadFactor.getCurrentFactor());
             } else if (dynamicExtraLoadFactor.isMaxReached()) {
                 log.warn("isPoolQueueLow(): Max loading factor steps reached: {}/{}", dynamicExtraLoadFactor.getCurrentFactor(), dynamicExtraLoadFactor.getMaxFactor());
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index f2e5cb090..9ac1ab02e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -4,7 +4,9 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.BackportUtils;
 import io.confluent.csid.utils.LoopingResumingIterator;
+import io.confluent.csid.utils.TimeUtils;
 import io.confluent.csid.utils.WallClock;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import lombok.Getter;
@@ -26,6 +28,7 @@
 import java.util.concurrent.atomic.AtomicBoolean;
 import java.util.function.Consumer;
 
+import static io.confluent.csid.utils.BackportUtils.toSeconds;
 import static io.confluent.csid.utils.KafkaUtils.toTP;
 import static io.confluent.csid.utils.LogUtils.at;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
@@ -355,7 +358,7 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
                 } else {
                     Duration timeInFlight = wc.getTimeInFlight();
                     Level level = Level.TRACE;
-                    if (timeInFlight.toSeconds() > 1) {
+                    if (toSeconds(timeInFlight) > 1) {
                         level = Level.WARN;
                     }
                     at(log, level).log("Work ({}) still delayed ({}) or is in flight ({}, time in flight: {}), alreadySucceeded? {} can't take...",
@@ -390,7 +393,7 @@ private void checkShardsForProgress() {
         for (var shard : processingShards.entrySet()) {
             for (final Map.Entry<Long, WorkContainer<K, V>> entry : shard.getValue().entrySet()) {
                 WorkContainer<K, V> work = entry.getValue();
-                long seconds = work.getTimeInFlight().toSeconds();
+                long seconds = toSeconds(work.getTimeInFlight());
                 if (work.isInFlight() && seconds > 1) {
                     log.warn("Work taking too long {} s : {}", seconds, entry);
                 }

From 5711b1d8fbe9db1215906731f8af76f29f16f98d Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 15:03:24 +0000
Subject: [PATCH 015/131] Better tests

---
 .../integrationTests/LoadTest.java            | 46 +++++++++++++------
 1 file changed, 33 insertions(+), 13 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
index 919929438..db7425f58 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
@@ -23,6 +23,8 @@
 import pl.tlinkowski.unij.api.UniLists;
 
 import java.util.*;
+import java.util.concurrent.Callable;
+import java.util.concurrent.Executors;
 import java.util.concurrent.Future;
 import java.util.concurrent.atomic.AtomicInteger;
 import java.util.regex.Pattern;
@@ -81,6 +83,7 @@ void asyncConsumeAndProcess() {
                 .commitMode(TRANSACTIONAL_PRODUCER)
                 .producer(kcu.createNewProducer(tx))
                 .consumer(newConsumer)
+                .numberOfThreads(3)
                 .build();
         newConsumer.subscribe(Pattern.compile(topic));
         ParallelEoSStreamProcessor<String, String> async = new ParallelEoSStreamProcessor<>(options);
@@ -91,13 +94,10 @@ void asyncConsumeAndProcess() {
         try (pb) {
             async.poll(r -> {
                 // message processing function
-                int simulatedCPUMessageProcessingDelay = nextInt(0, 5); // random delay between 0,5
-                try {
-                    Thread.sleep(simulatedCPUMessageProcessingDelay); // simulate json parsing overhead and network calls
-                } catch (Exception ignore) {
-                }
+                sleepABit();
+                // db isn interesting but not a great performance test, as the db quickly becomes the bottleneck, need to test against a db cluster that can scale better
                 // save to db
-                savePayload(r.key(), r.value());
+//                savePayload(r.key(), r.value());
                 //
                 msgCount.getAndIncrement();
             });
@@ -112,31 +112,51 @@ void asyncConsumeAndProcess() {
         async.close();
     }
 
+    private void sleepABit() {
+        int simulatedCPUMessageProcessingDelay = nextInt(0, 5); // random delay between 0,5
+        try {
+            Thread.sleep(simulatedCPUMessageProcessingDelay); // simulate json parsing overhead and network calls
+        } catch (Exception ignore) {
+        }
+    }
+
     private void readRecordsPlainConsumer(int total, String topic) {
         // read
         log.info("Starting to read back");
         final List<ConsumerRecord<String, String>> allRecords = Lists.newArrayList();
+        AtomicInteger count = new AtomicInteger();
         time(() -> {
             ProgressBar pb = ProgressBarUtils.getNewMessagesBar(log, total);
 
-            try (pb) {
-                await().atMost(ofSeconds(60)).untilAsserted(() -> {
-                    ConsumerRecords<String, String> poll = kcu.consumer.poll(ofMillis(5000));
+            Executors.newCachedThreadPool().submit(() -> {
+                while (allRecords.size() < total) {
+                    ConsumerRecords<String, String> poll = kcu.consumer.poll(ofMillis(500));
+                    log.info("Polled batch of {} messages", poll.count());
+
+                    //save
                     Iterable<ConsumerRecord<String, String>> records = poll.records(topic);
                     records.forEach(x -> {
                         // log.trace(x.toString());
-                        savePayload(x.key(), x.value());
+                        sleepABit();
+                        // db isn interesting but not a great performance test, as the db quickly becomes the bottleneck, need to test against a db cluster that can scale better
+//                        savePayload(x.key(), x.value());
+                        pb.step();
                         // log.debug(testDataEbean.toString());
                     });
 
+                    //
                     ArrayList<ConsumerRecord<String, String>> c = Lists.newArrayList(records);
-                    log.info("Got {} messages", c.size());
                     allRecords.addAll(c);
-                    pb.stepTo(allRecords.size());
+                    count.getAndAdd(c.size());
+                }
+            });
 
-                    assertThat(allRecords).hasSize(total); // awaitility#untilAsserted
+            try (pb) {
+                await().atMost(ofSeconds(60)).untilAsserted(() -> {
+                    assertThat(count).hasValue(total);
                 });
             }
+
         });
 
         assertThat(allRecords).hasSize(total);

From a858ff5327d92b828c785b91795c8ebeee1c7a49 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 15:08:05 +0000
Subject: [PATCH 016/131] Relax progress test for now

---
 .../integrationTests/TransactionAndCommitModeTest.java          | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index c2be2d199..564555787 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -250,7 +250,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order,
         // sanity
         assertThat(expectedMessageCount).isEqualTo(processedCount.get());
         assertThat(producedKeysAcknowledged).hasSameSizeAs(expectedKeys);
-        assertThat(pt.getHighestRoundCountSeen()).isLessThan(10);
+        assertThat(pt.getHighestRoundCountSeen()).isLessThan(30); // 3 seconds
     }
 
     @Test

From d0e164c12c9ef579fc3778a2037e9d5d3285103e Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 10 Dec 2020 15:18:01 +0000
Subject: [PATCH 017/131] Remove failfast

---
 .../TransactionAndCommitModeTest.java         | 19 +++++++++----------
 pom.xml                                       |  2 +-
 2 files changed, 10 insertions(+), 11 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index 564555787..6f63dab76 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -25,7 +25,6 @@
 import org.assertj.core.api.Assertions;
 import org.assertj.core.api.SoftAssertions;
 import org.awaitility.core.ConditionTimeoutException;
-import org.awaitility.core.TerminalFailureException;
 import org.junit.jupiter.api.RepeatedTest;
 import org.junit.jupiter.api.Test;
 import org.junitpioneer.jupiter.CartesianProductTest;
@@ -210,15 +209,15 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order,
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
             waitAtMost(ofSeconds(2000))
-                    .failFast(() -> pc.isClosedOrFailed()
-                                    || producedCount.get() > expectedMessageCount,
-                            () -> {
-                                if (pc.isClosedOrFailed())
-                                    return pc.getFailureCause();
-                                else
-                                    return new TerminalFailureException(msg("Too many messages? processedCount.get() {} > expectedMessageCount {}",
-                                            producedCount.get(), expectedMessageCount)); // needs fail-fast feature in 4.0.4 // TODO link
-                            })
+//                    .failFast(() -> pc.isClosedOrFailed() // needs fail-fast feature in 4.0.4 - https://github.com/awaitility/awaitility/pull/193
+//                                    || producedCount.get() > expectedMessageCount,
+//                            () -> {
+//                                if (pc.isClosedOrFailed())
+//                                    return pc.getFailureCause();
+//                                else
+//                                    return new TerminalFailureException(msg("Too many messages? processedCount.get() {} > expectedMessageCount {}",
+//                                            producedCount.get(), expectedMessageCount)); // needs fail-fast feature in 4.0.4 // TODO link
+//                            })
                     .alias(failureMessage)
                     .untilAsserted(() -> {
                         log.info("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
diff --git a/pom.xml b/pom.xml
index 551bd47e5..6080e16d1 100644
--- a/pom.xml
+++ b/pom.xml
@@ -328,7 +328,7 @@
             <dependency>
                 <groupId>org.awaitility</groupId>
                 <artifactId>awaitility</artifactId>
-                <version>4.0.4-SNAPSHOT</version>
+                <version>4.0.3</version>
                 <scope>test</scope>
             </dependency>
             <dependency>

From 0604b053bee9cb8aab0e89a6309912824ad2420c Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 8 Dec 2020 16:03:19 +0000
Subject: [PATCH 018/131] WIP rename max concurrency

---
 README.adoc                                     |  6 +++---
 .../ParallelConsumerOptions.java                | 17 +++++++++++++++--
 .../ParallelEoSStreamProcessor.java             |  8 ++++----
 .../confluent/parallelconsumer/WorkManager.java |  4 +---
 .../integrationTests/LoadTest.java              |  3 +--
 .../TransactionAndCommitModeTest.java           |  3 +--
 .../VeryLargeMessageVolumeTest.java             |  2 +-
 .../parallelconsumer/examples/core/CoreApp.java |  3 ++-
 src/docs/README.adoc                            |  3 +--
 9 files changed, 29 insertions(+), 20 deletions(-)

diff --git a/README.adoc b/README.adoc
index fb952f843..f9a210123 100644
--- a/README.adoc
+++ b/README.adoc
@@ -380,6 +380,7 @@ Where `${project.version}` is the version to be used:
 
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(KEY) // <2>
+                .numberOfThreads(1000) // <3>
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
@@ -387,15 +388,14 @@ Where `${project.version}` is the version to be used:
         ParallelStreamProcessor<String, String> eosStreamProcessor =
                 ParallelStreamProcessor.createEosStreamProcessor(options);
 
-        eosStreamProcessor.subscribe(of(inputTopic)); // <5>
+        eosStreamProcessor.subscribe(of(inputTopic)); // <4>
 
         return eosStreamProcessor;
 ----
 <1> Setup your clients as per normal. A Producer is only required if using the `produce` flows.
 <2> Choose your ordering type, `KEY` in this case.
 This ensures maximum concurrency, while ensuring messages are processed and committed in `KEY` order, making sure no offset is committed unless all offsets before it in it's partition, are completed also.
-<3> The maximum number of concurrent processing operations to be performing at any given time
-<4> Regardless of the level of concurrency, don't have more than this many messages uncommitted at any given time.
+<3> The maximum number of concurrent processing operations to be performing at any given time.
 Also, because the library coordinates offsets, `enable.auto.commit` must be disabled in your consumer.
 <5> Subscribe to your topics
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
index dff470b7f..66f6f0917 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
@@ -97,10 +97,23 @@ public enum CommitMode {
     private final CommitMode commitMode = CommitMode.CONSUMER_ASYNCHRONOUS;
 
     /**
-     * Number of threads to use in the core's thread pool.
+     * Controls the maximum degree of concurrency to occur. Used to limit concurrent calls to external systems to a
+     * maximum to prevent overloading them or to a degree, using up quotas.
+     * <p>
+     * A note on quotas - if your quota is expressed as maximum concurrent calls, this works well. If it's limited in
+     * total requests / sec, this may still overload the system. See towards the distributed rate limiting feature for
+     * this to be properly addressed: https://github.com/confluentinc/parallel-consumer/issues/24 Add distributed rate
+     * limiting support #24.
+     * <p>
+     * In the core module, this sets the number of threads to use in the core's thread pool.
+     * <p>
+     * It's recommended to set this quite high, much higher than core count, as it's expected that these threads will
+     * spend most of their time blocked waiting for IO. For automatic setting of this variable, look out for issue
+     * https://github.com/confluentinc/parallel-consumer/issues/21 Dynamic concurrency control with flow control or tcp
+     * congestion control theory #21.
      */
     @Builder.Default
-    private final int numberOfThreads = 16;
+    private final int maxConcurrency = 16;
 
     public void validate() {
         Objects.requireNonNull(consumer, "A consumer must be supplied");
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index fab0bcc4b..2c2b5a38a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -181,7 +181,7 @@ public ParallelEoSStreamProcessor(ParallelConsumerOptions newOptions) {
         checkAutoCommitIsDisabled(consumer);
 
         LinkedBlockingQueue<Runnable> poolQueue = new LinkedBlockingQueue<>();
-        workerPool = new ThreadPoolExecutor(newOptions.getNumberOfThreads(), newOptions.getNumberOfThreads(),
+        workerPool = new ThreadPoolExecutor(newOptions.getMaxConcurrency(), newOptions.getMaxConcurrency(),
                 0L, MILLISECONDS,
                 poolQueue);
 
@@ -612,7 +612,7 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
                 // can occur
                 log.debug("Found Poller paused with not enough front loaded messages, ensuring poller is awake (mail: {} vs concurrency: {})",
                         wm.getWorkQueuedInMailboxCount(),
-                        options.getNumberOfThreads());
+                        options.getMaxConcurrency());
                 brokerPollSubsystem.wakeupIfPaused();
             }
         }
@@ -708,7 +708,7 @@ private int getQueueTargetLoaded() {
     }
 
     private void checkPressure() {
-        boolean moreWorkInQueuesAvailableThatHaveNotBeenPulled = wm.getWorkQueuedInMailboxCount() > options.getNumberOfThreads();
+        boolean moreWorkInQueuesAvailableThatHaveNotBeenPulled = wm.getWorkQueuedInMailboxCount() > options.getMaxConcurrency();
         if (log.isTraceEnabled())
             log.trace("Queue pressure check: (current size: {}, loaded target: {}, factor: {}) if (isPoolQueueLow() {} && dynamicExtraLoadFactor.isWarmUpPeriodOver() {} && moreWorkInQueuesAvailableThatHaveNotBeenPulled {}) {",
                     getWorkerQueueSize(),
@@ -732,7 +732,7 @@ private void checkPressure() {
      * @return aim to never have the pool queue drop below this
      */
     private int getPoolQueueTarget() {
-        return options.getNumberOfThreads();
+        return options.getMaxConcurrency();
     }
 
     private boolean isPoolQueueLow() {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index 9ac1ab02e..5e3cbe015 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -4,9 +4,7 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
-import io.confluent.csid.utils.BackportUtils;
 import io.confluent.csid.utils.LoopingResumingIterator;
-import io.confluent.csid.utils.TimeUtils;
 import io.confluent.csid.utils.WallClock;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import lombok.Getter;
@@ -673,7 +671,7 @@ boolean isSufficientlyLoaded() {
 //
 //        return !workInbox.isEmpty();
 
-        return getWorkQueuedInMailboxCount() > options.getNumberOfThreads() * getLoadingFactor();
+        return getWorkQueuedInMailboxCount() > options.getMaxConcurrency() * getLoadingFactor();
     }
 
     private int getLoadingFactor() {
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
index db7425f58..b7e9194c2 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
@@ -23,7 +23,6 @@
 import pl.tlinkowski.unij.api.UniLists;
 
 import java.util.*;
-import java.util.concurrent.Callable;
 import java.util.concurrent.Executors;
 import java.util.concurrent.Future;
 import java.util.concurrent.atomic.AtomicInteger;
@@ -83,7 +82,7 @@ void asyncConsumeAndProcess() {
                 .commitMode(TRANSACTIONAL_PRODUCER)
                 .producer(kcu.createNewProducer(tx))
                 .consumer(newConsumer)
-                .numberOfThreads(3)
+                .maxConcurrency(3)
                 .build();
         newConsumer.subscribe(Pattern.compile(topic));
         ParallelEoSStreamProcessor<String, String> async = new ParallelEoSStreamProcessor<>(options);
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index 6f63dab76..0f2cb909f 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -6,7 +6,6 @@
 
 import io.confluent.csid.utils.EnumCartesianProductTestSets;
 import io.confluent.csid.utils.ProgressTracker;
-import io.confluent.csid.utils.StringUtils;
 import io.confluent.csid.utils.TrimListRepresentation;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode;
@@ -168,7 +167,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order,
 //                .numberOfThreads(1000)
 //                .numberOfThreads(100)
 //                .numberOfThreads(2)
-                .numberOfThreads(numThreads)
+                .maxConcurrency(numThreads)
                 .build());
         pc.subscribe(of(inputName));
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
index 0fb0f3446..0b8eca9cc 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
@@ -118,7 +118,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                 .producer(newProducer)
                 .commitMode(commitMode)
 //                .numberOfThreads(1)
-                .numberOfThreads(1000)
+                .maxConcurrency(1000)
                 .build());
         pc.subscribe(of(inputName));
 
diff --git a/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java b/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
index a8516d9cd..7cd41832d 100644
--- a/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
+++ b/parallel-consumer-examples/parallel-consumer-example-core/src/main/java/io/confluent/parallelconsumer/examples/core/CoreApp.java
@@ -66,6 +66,7 @@ ParallelStreamProcessor<String, String> setupParallelConsumer() {
 
         var options = ParallelConsumerOptions.<String, String>builder()
                 .ordering(KEY) // <2>
+                .maxConcurrency(1000) // <3>
                 .consumer(kafkaConsumer)
                 .producer(kafkaProducer)
                 .build();
@@ -73,7 +74,7 @@ ParallelStreamProcessor<String, String> setupParallelConsumer() {
         ParallelStreamProcessor<String, String> eosStreamProcessor =
                 ParallelStreamProcessor.createEosStreamProcessor(options);
 
-        eosStreamProcessor.subscribe(of(inputTopic)); // <5>
+        eosStreamProcessor.subscribe(of(inputTopic)); // <4>
 
         return eosStreamProcessor;
         // end::exampleSetup[]
diff --git a/src/docs/README.adoc b/src/docs/README.adoc
index d0a1f01c6..ce66458f5 100644
--- a/src/docs/README.adoc
+++ b/src/docs/README.adoc
@@ -370,8 +370,7 @@ include::{project_root}/parallel-consumer-examples/parallel-consumer-example-cor
 <1> Setup your clients as per normal. A Producer is only required if using the `produce` flows.
 <2> Choose your ordering type, `KEY` in this case.
 This ensures maximum concurrency, while ensuring messages are processed and committed in `KEY` order, making sure no offset is committed unless all offsets before it in it's partition, are completed also.
-<3> The maximum number of concurrent processing operations to be performing at any given time
-<4> Regardless of the level of concurrency, don't have more than this many messages uncommitted at any given time.
+<3> The maximum number of concurrent processing operations to be performing at any given time.
 Also, because the library coordinates offsets, `enable.auto.commit` must be disabled in your consumer.
 <5> Subscribe to your topics
 

From 803faf877c87872040a6c16e590bbfc2874243b0 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 27 Nov 2020 16:44:55 +0000
Subject: [PATCH 019/131] Fix back-pressure system
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Tests

test

impl

More

Wip! Experiments in self tuning

Try to measure rate and do ... what?

Performance breakthrough - pressure system all the way back to the consumer

Remove old vars, docs

Progress bar refactor

Tidy up

Not sure the queue being empty means what I think it means. try loading thread instead

Dynamic loading factor

1mill

WIP! Encode offsets continuously to assess required space

Heavy docs and clarifications

Draft algo complete

More

More

Encoders, fix mock rebalancing

More

More

More

More - use info to stop more records

Move consumer back to PC wrapped for thread safety, so commits are in line with control

More

More

More - fix parameter naming

More naming and fix consumer locking

Conditions when no encoding is needed from registered useless continuous encoders - very large test passes

More - add work container epoch - ignore old fenced off work when partition assignment changes

More- have both old and new styles see the same data - results now equal

More efficient loop

Big change - stop using old find scan and use continuous instead

manageOffsetEncoderSpaceRequirements only once per batch

Encoders truncate and reinitialise themselves

Slow test

Run length continuous fixes

Truncate bitset correctly, disalbe/enable encoders as needed

Test fixes

Test fixes

RunLength V1 works

Fix sim encoder ignore base offset change

Wip! Fixing bitset

Fix highest seen record check

Fix bitset

More

More

Better tests

Draft test for offset back-pressure

More

More

More - OffsetEncodingBackPressureTest passes

Cleanup

Cleanup

More

Fix run length truncate function also O(n) to O(m)

Runlength encoding fix, trying v2

Run length offset pairs encoding

Run length offset pairs encoding

V2 more - test pass

More

Fix run length encoding for base != 0 and new base offsets beyond our run length

Segment, combine, extend

Collapsing up and down

Whops

3 tests left

Progress

Test fixes

So many tests are broken…
---
 .../io/confluent/csid/utils/JavaUtils.java    |   11 +
 .../java/io/confluent/csid/utils/Range.java   |   33 +-
 .../AbstractOffsetCommitter.java              |   47 +-
 .../parallelconsumer/BitsetEncoder.java       |  182 ++-
 .../parallelconsumer/BrokerPollSystem.java    |  113 +-
 .../parallelconsumer/ByteBufferEncoder.java   |   42 +-
 .../parallelconsumer/ConsumerManager.java     |  203 +++-
 .../ConsumerOffsetCommitter.java              |    4 +-
 ...OffsetPair.java => EncodedOffsetData.java} |   10 +-
 .../ExponentialMovingAverage.java             |   21 +
 .../InternalRuntimeError.java                 |    6 +
 .../parallelconsumer/OffsetBitSet.java        |   14 +-
 .../parallelconsumer/OffsetEncoder.java       |   61 -
 .../parallelconsumer/OffsetEncoderBase.java   |  148 +++
 .../OffsetEncoderContract.java                |   29 +
 .../parallelconsumer/OffsetEncoding.java      |    5 +
 .../OffsetMapCodecManager.java                |   78 +-
 .../OffsetSimpleSerialisation.java            |    2 +-
 .../OffsetSimultaneousEncoder.java            |  441 ++++++--
 .../ParallelConsumerOptions.java              |    1 +
 .../ParallelEoSStreamProcessor.java           |  174 ++-
 .../parallelconsumer/RunLengthEncoder.java    |  612 +++++++++-
 .../parallelconsumer/WindowedEventRate.java   |   30 +
 .../parallelconsumer/WorkContainer.java       |   49 +-
 .../parallelconsumer/WorkManager.java         | 1004 +++++++++++++++--
 .../CloseAndOpenOffsetTest.java               |    2 +-
 .../LargeVolumeInMemoryTests.java             |    3 +-
 .../integrationTests/LoadTest.java            |   15 +-
 .../TransactionAndCommitModeTest.java         |    5 +-
 .../VeryLargeMessageVolumeTest.java           |   41 +-
 .../confluent/csid/utils/KafkaTestUtils.java  |    5 +-
 .../csid/utils/LongPollingMockConsumer.java   |   27 +-
 .../io/confluent/csid/utils/ThreadUtils.java  |   10 +
 .../parallelconsumer/BackPressureTests.java   |   83 ++
 .../parallelconsumer/BitSetEncoderTest.java   |   70 ++
 .../ContinuousEncodingTests.java              |  271 +++++
 .../OffsetEncodingBackPressureTest.java       |  140 +++
 .../parallelconsumer/OffsetEncodingTests.java |   75 +-
 .../OffsetSimultaneousEncoderTest.java        |   36 +
 .../ParallelEoSStreamProcessorTestBase.java   |   33 +-
 .../RunLengthEncoderTest.java                 |  562 +++++++++
 .../WorkManagerOffsetMapCodecManagerTest.java |  229 ++--
 .../parallelconsumer/WorkManagerTest.java     |  194 +++-
 .../test/resources/junit-platform.properties  |    2 +-
 .../src/test/resources/logback-test.xml       |    2 +
 pom.xml                                       |    2 +-
 46 files changed, 4285 insertions(+), 842 deletions(-)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
 rename parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/{EncodedOffsetPair.java => EncodedOffsetData.java} (93%)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
 delete mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoder.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderBase.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderContract.java
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BitSetEncoderTest.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ContinuousEncodingTests.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingBackPressureTest.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoderTest.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/RunLengthEncoderTest.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
new file mode 100644
index 000000000..e08d3363a
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
@@ -0,0 +1,11 @@
+package io.confluent.csid.utils;
+
+import io.confluent.parallelconsumer.InternalRuntimeError;
+import lombok.experimental.UtilityClass;
+
+@UtilityClass
+public class JavaUtils {
+    public static int safeCast(final long aLong) {
+        return Math.toIntExact(aLong);
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index 88972cce0..2129d41f4 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -4,19 +4,44 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
+import io.confluent.parallelconsumer.InternalRuntimeError;
+
 import java.util.*;
 import java.util.function.Consumer;
 import java.util.stream.IntStream;
 
 /**
+ * for (var i : range) {}
+ * <p>
  * https://stackoverflow.com/a/16570509/105741
  */
 public class Range implements Iterable<Integer> {
 
-    private long limit;
+    private int base = 0;
+    private int limit;
 
+    /**
+     * @param limit exclusive
+     */
     public Range(long limit) {
-        this.limit = limit;
+        this.limit = (int) limit;
+        checkIntegerOverflow(this.limit, limit);
+    }
+
+    /**
+     * @param base inclusive
+     * @param limit exclusive
+     */
+    public Range(long base, long limit) {
+        this.base = (int) base;
+        checkIntegerOverflow(this.base, base);
+        this.limit = (int) limit;
+        checkIntegerOverflow(this.limit, limit);
+    }
+
+    private void checkIntegerOverflow(final int actual, final long expected) {
+        if (actual != expected)
+            throw new InternalRuntimeError(StringUtils.msg("Overflow {} from {}", actual, expected));
     }
 
     public static Range range(long max) {
@@ -28,7 +53,7 @@ public Iterator<Integer> iterator() {
         final long max = limit;
         return new Iterator<Integer>() {
 
-            private int current = 0;
+            private int current = base;
 
             @Override
             public boolean hasNext() {
@@ -58,7 +83,7 @@ public List<Integer> list() {
     }
 
     public IntStream toStream() {
-        return IntStream.range(0, (int)limit);
+        return IntStream.range(0, (int) limit);
     }
 
     static IntStream rangeStream(int i) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/AbstractOffsetCommitter.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/AbstractOffsetCommitter.java
index 4f0167987..fe8d2cde4 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/AbstractOffsetCommitter.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/AbstractOffsetCommitter.java
@@ -1,6 +1,7 @@
 package io.confluent.parallelconsumer;
 
 import lombok.RequiredArgsConstructor;
+import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerGroupMetadata;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
@@ -18,27 +19,35 @@ public abstract class AbstractOffsetCommitter<K, V> implements OffsetCommitter {
     /**
      * Get offsets from {@link WorkManager} that are ready to commit
      */
+    @SneakyThrows
     @Override
     public void retrieveOffsetsAndCommit() {
-        log.debug("Commit starting - find completed work to commit offsets");
-        // todo shouldn't be removed until commit succeeds (there's no harm in committing the same offset twice)
-        preAcquireWork();
+        log.debug("Commit process starting");
+        consumerMgr.aquireLock();
+
         try {
-            Map<TopicPartition, OffsetAndMetadata> offsetsToSend = wm.findCompletedEligibleOffsetsAndRemove();
-            if (offsetsToSend.isEmpty()) {
-                log.trace("No offsets ready");
-            } else {
-                log.debug("Will commit offsets for {} partition(s): {}", offsetsToSend.size(), offsetsToSend);
-                ConsumerGroupMetadata groupMetadata = consumerMgr.groupMetadata();
-
-                log.debug("Begin commit");
-                commitOffsets(offsetsToSend, groupMetadata);
-
-                log.debug("On commit success");
-                onOffsetCommitSuccess(offsetsToSend);
+            // todo shouldn't be removed until commit succeeds (there's no harm in committing the same offset twice)
+            preAcquireWork();
+            try {
+                //Map<TopicPartition, OffsetAndMetadata> offsetsToSend = wm.findCompletedEligibleOffsetsAndRemove();
+                Map<TopicPartition, OffsetAndMetadata> offsetsToSend = wm.serialiseEncoders();
+                if (offsetsToSend.isEmpty()) {
+                    log.trace("No offsets ready");
+                } else {
+                    log.debug("Will commit offsets for {} partition(s): {}", offsetsToSend.size(), offsetsToSend);
+                    ConsumerGroupMetadata groupMetadata = consumerMgr.groupMetadata();
+
+                    log.debug("Begin commit");
+                    commitOffsets(offsetsToSend, groupMetadata);
+
+                    log.debug("On commit success");
+                    onOffsetCommitSuccess(offsetsToSend);
+                }
+            } finally {
+                postCommit();
             }
-        } finally {
-            postCommit();
+        }finally {
+            consumerMgr.releaseLock();
         }
     }
 
@@ -50,8 +59,8 @@ protected void preAcquireWork() {
         // default noop
     }
 
-    private void onOffsetCommitSuccess(final Map<TopicPartition, OffsetAndMetadata> offsetsToSend) {
-        wm.onOffsetCommitSuccess(offsetsToSend);
+    private void onOffsetCommitSuccess(final Map<TopicPartition, OffsetAndMetadata> offsetsCommitted) {
+        wm.onOffsetCommitSuccess(offsetsCommitted);
     }
 
     protected abstract void commitOffsets(final Map<TopicPartition, OffsetAndMetadata> offsetsToSend, final ConsumerGroupMetadata groupMetadata);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BitsetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BitsetEncoder.java
index c9badd93e..1842dae3d 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BitsetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BitsetEncoder.java
@@ -1,11 +1,16 @@
 package io.confluent.parallelconsumer;
 
-import io.confluent.csid.utils.StringUtils;
+import lombok.SneakyThrows;
+import lombok.ToString;
+import lombok.extern.slf4j.Slf4j;
 
+import java.nio.BufferOverflowException;
 import java.nio.ByteBuffer;
 import java.util.BitSet;
 import java.util.Optional;
 
+import static io.confluent.csid.utils.JavaUtils.safeCast;
+import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.OffsetEncoding.*;
 
 /**
@@ -28,63 +33,83 @@
  * @see RunLengthEncoder
  * @see OffsetBitSet
  */
-class BitsetEncoder extends OffsetEncoder {
+@ToString(onlyExplicitlyIncluded = true, callSuper = true)
+@Slf4j
+class BitsetEncoder extends OffsetEncoderBase {
 
+    @ToString.Include
     private final Version version; // default to new version
 
+    @ToString.Include
     private static final Version DEFAULT_VERSION = Version.v2;
 
     public static final Integer MAX_LENGTH_ENCODABLE = Integer.MAX_VALUE;
 
-    private ByteBuffer wrappedBitsetBytesBuffer;
-    private final BitSet bitSet;
+    @ToString.Include
+    private int originalLength;
+//    private ByteBuffer wrappedBitsetBytesBuffer;
+
+    BitSet bitSet = new BitSet();
 
     private Optional<byte[]> encodedBytes = Optional.empty();
 
-    public BitsetEncoder(int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) throws BitSetEncodingNotSupportedException {
-        this(length, offsetSimultaneousEncoder, DEFAULT_VERSION);
+    public BitsetEncoder(long baseOffset, int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) throws BitSetEncodingNotSupportedException {
+        this(baseOffset, length, offsetSimultaneousEncoder, DEFAULT_VERSION);
     }
 
-    public BitsetEncoder(int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) throws BitSetEncodingNotSupportedException {
-        super(offsetSimultaneousEncoder);
+    public BitsetEncoder(long baseOffset, int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) throws BitSetEncodingNotSupportedException {
+        super(baseOffset, offsetSimultaneousEncoder);
 
         this.version = newVersion;
 
-        switch (newVersion) {
+        reinitialise(baseOffset, length);
+    }
+
+    private ByteBuffer constructWrappedByteBuffer(final int length, final Version newVersion) throws BitSetEncodingNotSupportedException {
+        return switch (newVersion) {
             case v1 -> initV1(length);
             case v2 -> initV2(length);
-        }
-        bitSet = new BitSet(length);
+        };
     }
 
     /**
      * Switch from encoding bitset length as a short to an integer (length of 32,000 was reasonable too short).
      * <p>
      * Integer.MAX_VALUE should always be good enough as system restricts large from being processed at once.
+     *
+     * @return
      */
-    private void initV2(int length) throws BitSetEncodingNotSupportedException {
+    private ByteBuffer initV2(int length) throws BitSetEncodingNotSupportedException {
         if (length > MAX_LENGTH_ENCODABLE) {
             // need to upgrade to using Integer for the bitset length, but can't change serialisation format in-place
-            throw new BitSetEncodingNotSupportedException(StringUtils.msg("Bitset V2 too long to encode, as length overflows Integer.MAX_VALUE. Length: {}. (max: {})", length, MAX_LENGTH_ENCODABLE));
+            throw new BitSetEncodingNotSupportedException(msg("Bitset V2 too long to encode, as length overflows Integer.MAX_VALUE. Length: {}. (max: {})", length, MAX_LENGTH_ENCODABLE));
         }
+
         // prep bit set buffer
-        this.wrappedBitsetBytesBuffer = ByteBuffer.allocate(Integer.BYTES + ((length / 8) + 1));
+        ByteBuffer wrappedBitsetBytesBuffer = ByteBuffer.allocate(Integer.BYTES + ((length / 8) + 1));
         // bitset doesn't serialise it's set capacity, so we have to as the unused capacity actually means something
-        this.wrappedBitsetBytesBuffer.putInt(length);
+        wrappedBitsetBytesBuffer.putInt(length);
+
+        return wrappedBitsetBytesBuffer;
     }
 
     /**
      * This was a bit "short" sighted of me....
+     *
+     * @return
      */
-    private void initV1(int length) throws BitSetEncodingNotSupportedException {
+    private ByteBuffer initV1(int length) throws BitSetEncodingNotSupportedException {
         if (length > Short.MAX_VALUE) {
             // need to upgrade to using Integer for the bitset length, but can't change serialisation format in-place
             throw new BitSetEncodingNotSupportedException("Bitset V1 too long to encode, bitset length overflows Short.MAX_VALUE: " + length + ". (max: " + Short.MAX_VALUE + ")");
         }
+
         // prep bit set buffer
-        this.wrappedBitsetBytesBuffer = ByteBuffer.allocate(Short.BYTES + ((length / 8) + 1));
+        ByteBuffer wrappedBitsetBytesBuffer = ByteBuffer.allocate(Short.BYTES + ((length / 8) + 1));
         // bitset doesn't serialise it's set capacity, so we have to as the unused capacity actually means something
-        this.wrappedBitsetBytesBuffer.putShort((short) length);
+        wrappedBitsetBytesBuffer.putShort((short) length);
+
+        return wrappedBitsetBytesBuffer;
     }
 
     @Override
@@ -104,23 +129,60 @@ protected OffsetEncoding getEncodingTypeCompressed() {
     }
 
     @Override
-    public void encodeIncompleteOffset(final int index) {
+    public void encodeIncompleteOffset(final long newBaseOffset, final int relativeOffset) {
         // noop - bitset defaults to 0's (`unset`)
     }
 
     @Override
-    public void encodeCompletedOffset(final int index) {
-        bitSet.set(index);
+    public void encodeCompletedOffset(final long newBaseOffset, final int relativeOffset) {
+        log.trace("Relative offset set {}", relativeOffset);
+        bitSet.set(relativeOffset);
     }
 
+    @SneakyThrows
     @Override
     public byte[] serialise() {
         final byte[] bitSetArray = this.bitSet.toByteArray();
-        this.wrappedBitsetBytesBuffer.put(bitSetArray);
-        final byte[] array = this.wrappedBitsetBytesBuffer.array();
+        ByteBuffer wrappedBitsetBytesBuffer = constructWrappedByteBuffer(originalLength, version);
+        if (wrappedBitsetBytesBuffer.remaining() < bitSetArray.length)
+            throw new InternalRuntimeError("Not enough space in byte array");
+        try {
+            wrappedBitsetBytesBuffer.put(bitSetArray);
+        } catch (BufferOverflowException e) {
+            log.error("{}", e);
+            throw e;
+        }
+        final byte[] array = wrappedBitsetBytesBuffer.array();
         this.encodedBytes = Optional.of(array);
         return array;
     }
+//
+//    @Override
+//    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset) {
+//        super(baseOffset, relativeOffset);
+//    }
+//
+//    @Override
+//    public void encodeCompletedOffset(final long baseOffset, final long relativeOffset) {
+//        super(baseOffset, relativeOffset);
+//    }
+
+    @Override
+    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+        // noop - bitset defaults to 0's (`unset`)
+
+    }
+
+    @Override
+    public void encodeCompleteOffset(final long newBaseOffset, final long relativeOffset, final long currentHighestCompleted) {
+        try {
+            maybeReinitialise(newBaseOffset, currentHighestCompleted);
+        } catch (EncodingNotSupportedException e) {
+            this.disable(e);
+        }
+
+        encodeCompletedOffset(newBaseOffset, safeCast(relativeOffset));
+    }
 
     @Override
     public int getEncodedSize() {
@@ -128,7 +190,79 @@ public int getEncodedSize() {
     }
 
     @Override
-    protected byte[] getEncodedBytes() {
+    public int getEncodedSizeEstimate() {
+        int logicalSize = originalLength / Byte.SIZE;
+        return logicalSize + getLengthEntryBytes();
+    }
+
+    @Override
+    public void maybeReinitialise(final long newBaseOffset, final long currentHighestCompleted) throws EncodingNotSupportedException {
+        boolean reinitialise = false;
+
+        long newLength = currentHighestCompleted - newBaseOffset;
+        if (originalLength != newLength) {
+//        if (this.highestSucceeded != currentHighestCompleted) {
+            log.debug("Length of Bitset changed {} to {}",
+                    originalLength, newLength);
+            reinitialise = true;
+        }
+
+        if (originalBaseOffset != newBaseOffset) {
+            log.debug("Base offset {} has moved to {} - new continuous blocks of successful work - need to shift bitset right",
+                    this.originalBaseOffset, newBaseOffset);
+            reinitialise = true;
+        }
+
+        if (newBaseOffset < originalBaseOffset)
+            throw new InternalRuntimeError("");
+
+        if (reinitialise) {
+            reinitialise(newBaseOffset, newLength);
+        }
+
+    }
+
+    private void reinitialise(final long newBaseOffset, final long newLength) throws BitSetEncodingNotSupportedException {
+        if (newLength == -1) {
+            log.debug("Nothing to encode, highest successful offset one behind out starting point");
+            bitSet = new BitSet();
+            this.originalLength = Math.toIntExact(newLength);
+            return;
+        } else if (newLength < -2) {
+            throw new InternalRuntimeError("Invalid state - highest successful too far behind starting point");
+        }
+
+        long baseDelta = newBaseOffset - originalBaseOffset;
+        // truncate at new relative delta
+
+        int endIndex = safeCast(baseDelta + originalLength + 1);
+        int startIndex = (int) baseDelta;
+        BitSet truncated = this.bitSet.get(startIndex, endIndex);
+        this.bitSet = new BitSet(safeCast(newLength));
+        this.bitSet.or(truncated); // fill with old values
+
+//        bitSet = new BitSet(length);
+
+        this.originalLength = Math.toIntExact(newLength);
+
+        // TODO throws away whats returned
+        constructWrappedByteBuffer(safeCast(newLength), this.version);
+
+//            this.bitSet = new BitSet((int) newLength);
+
+
+        enable();
+    }
+
+    private int getLengthEntryBytes() {
+        return switch (version) {
+            case v1 -> Short.BYTES;
+            case v2 -> Integer.BYTES;
+        };
+    }
+
+    @Override
+    public byte[] getEncodedBytes() {
         return this.encodedBytes.get();
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
index 7ea06d5c3..f87d47995 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/BrokerPollSystem.java
@@ -32,7 +32,7 @@
  * @param <V>
  */
 @Slf4j
-public class BrokerPollSystem<K, V> implements OffsetCommitter {
+public class BrokerPollSystem<K, V> {//implements OffsetCommitter {
 
     private final ConsumerManager<K, V> consumerManager;
 
@@ -45,7 +45,7 @@ public class BrokerPollSystem<K, V> implements OffsetCommitter {
 
     private final ParallelEoSStreamProcessor<K, V> pc;
 
-    private Optional<ConsumerOffsetCommitter<K, V>> committer = Optional.empty();
+//    private Optional<ConsumerOffsetCommitter<K, V>> committer = Optional.empty();
 
     /**
      * Note how this relates to {@link BrokerPollSystem#getLongPollTimeout()} - if longPollTimeout is high and loading
@@ -57,17 +57,24 @@ public class BrokerPollSystem<K, V> implements OffsetCommitter {
 
     private final WorkManager<K, V> wm;
 
-    public BrokerPollSystem(ConsumerManager<K, V> consumerMgr, WorkManager<K, V> wm, ParallelEoSStreamProcessor<K, V> pc, final ParallelConsumerOptions options) {
+    public BrokerPollSystem(
+            ConsumerManager<K, V> consumerMgr,
+                            WorkManager<K, V> wm, ParallelEoSStreamProcessor<K, V> pc
+//            ,
+//                            final ParallelConsumerOptions options
+    ) {
         this.wm = wm;
         this.pc = pc;
 
         this.consumerManager = consumerMgr;
-        switch (options.getCommitMode()) {
-            case CONSUMER_SYNC, CONSUMER_ASYNCHRONOUS -> {
-                ConsumerOffsetCommitter<K, V> consumerCommitter = new ConsumerOffsetCommitter<>(consumerMgr, wm, options);
-                committer = Optional.of(consumerCommitter);
-            }
-        }
+
+//        this.consumerManager = consumerMgr;
+//        switch (options.getCommitMode()) {
+//            case CONSUMER_SYNC, CONSUMER_ASYNCHRONOUS -> {
+//                ConsumerOffsetCommitter<K, V> consumerCommitter = new ConsumerOffsetCommitter<>(consumerMgr, wm, options);
+//                committer = Optional.of(consumerCommitter);
+//            }
+//        }
     }
 
     public void start() {
@@ -94,7 +101,7 @@ public void supervise() {
     private boolean controlLoop() {
         Thread.currentThread().setName("broker-poll");
         log.trace("Broker poll control loop start");
-        committer.ifPresent(x -> x.claim());
+
         try {
             while (state != closed) {
                 log.trace("Loop: Broker poller: ({})", state);
@@ -112,7 +119,7 @@ private boolean controlLoop() {
                     }
                 }
 
-                maybeDoCommit();
+//                maybeDoCommit();
 
                 switch (state) {
                     case draining -> {
@@ -134,33 +141,33 @@ private boolean controlLoop() {
 
     private void transitionToCloseMaybe() {
         // make sure everything is committed
-        if (isResponsibleForCommits() && !wm.isRecordsAwaitingToBeCommitted()) {
-            // transition to closing
+//        if (isResponsibleForCommits() && !wm.isRecordsAwaitingToBeCommitted()) {
+//           //  transition to closing
             state = ParallelEoSStreamProcessor.State.closing;
-        }
+//        }
     }
 
     private void doClose() {
         doPause();
-        maybeCloseConsumer();
+//        maybeCloseConsumer();
         state = closed;
     }
 
-    /**
-     * To keep things simple, make sure the correct thread which can make a commit, is the one to close the consumer.
-     * This way, if partitions are revoked, the commit can be made inline.
-     */
-    private void maybeCloseConsumer() {
-        if (isResponsibleForCommits()) {
-            log.debug("Closing {}, first closing consumer...", this.getClass().getSimpleName());
-            this.consumerManager.close(DrainingCloseable.DEFAULT_TIMEOUT);
-            log.debug("Consumer closed.");
-        }
-    }
-
-    private boolean isResponsibleForCommits() {
-        return committer.isPresent();
-    }
+//    /**
+//     * To keep things simple, make sure the correct thread which can make a commit, is the one to close the consumer.
+//     * This way, if partitions are revoked, the commit can be made inline.
+//     */
+//    private void maybeCloseConsumer() {
+////        if (isResponsibleForCommits()) {
+//            log.debug("Closing {}, first closing consumer...", this.getClass().getSimpleName());
+//            this.consumerManager.close(DrainingCloseable.DEFAULT_TIMEOUT);
+//            log.debug("Consumer closed.");
+//        }
+//    }
+
+//    private boolean isResponsibleForCommits() {
+//        return committer.isPresent();
+//    }
 
     private ConsumerRecords<K, V> pollBrokerForRecords() {
         managePauseOfSubscription();
@@ -170,7 +177,7 @@ private ConsumerRecords<K, V> pollBrokerForRecords() {
                 : Duration.ofMillis(1); // Can't use Duration.ZERO - this causes Object#wait to wait forever
 
         log.debug("Long polling broker with timeout {} seconds, might appear to sleep here if subs are paused, or no data available on broker.", toSeconds(thisLongPollTimeout)); // java 8
-        return consumerManager.poll(thisLongPollTimeout);
+        return this.consumerManager.poll(thisLongPollTimeout);
     }
 
     /**
@@ -275,28 +282,28 @@ private boolean shouldThrottle() {
         return wm.shouldThrottle();
     }
 
-    /**
-     * Optionally blocks. Threadsafe
-     *
-     * @see CommitMode
-     */
-    @SneakyThrows
-    @Override
-    public void retrieveOffsetsAndCommit() {
-        // {@link Optional#ifPresentOrElse} only @since 9
-        ConsumerOffsetCommitter<K, V> committer = this.committer.orElseThrow(() -> {
-            // shouldn't be here
-            throw new IllegalStateException("No committer configured");
-        });
-        committer.commit();
-    }
-
-    /**
-     * Will silently skip if not configured with a committer
-     */
-    private void maybeDoCommit() {
-        committer.ifPresent(ConsumerOffsetCommitter::maybeDoCommit);
-    }
+//    /**
+//     * Optionally blocks. Threadsafe
+//     *
+//     * @see CommitMode
+//     */
+//    @SneakyThrows
+//    @Override
+//    public void retrieveOffsetsAndCommit() {
+//        // {@link Optional#ifPresentOrElse} only @since 9
+//        ConsumerOffsetCommitter<K, V> committer = this.committer.orElseThrow(() -> {
+//            // shouldn't be here
+//            throw new IllegalStateException("No committer configured");
+//        });
+//        committer.commit();
+//    }
+//
+//    /**
+//     * Will silently skip if not configured with a committer
+//     */
+//    private void maybeDoCommit() {
+//        committer.ifPresent(ConsumerOffsetCommitter::maybeDoCommit);
+//    }
 
     /**
      * Wakeup if colling the broker
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ByteBufferEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ByteBufferEncoder.java
index 5a4003bab..5112294e9 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ByteBufferEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ByteBufferEncoder.java
@@ -5,12 +5,12 @@
 import static io.confluent.parallelconsumer.OffsetEncoding.ByteArray;
 import static io.confluent.parallelconsumer.OffsetEncoding.ByteArrayCompressed;
 
-class ByteBufferEncoder extends OffsetEncoder {
+class ByteBufferEncoder extends OffsetEncoderBase {
 
     private final ByteBuffer bytesBuffer;
 
-    public ByteBufferEncoder(final int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
-        super(offsetSimultaneousEncoder);
+    public ByteBufferEncoder(final long baseOffset, final int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
+        super(baseOffset, offsetSimultaneousEncoder);
         this.bytesBuffer = ByteBuffer.allocate(1 + length);
     }
 
@@ -25,12 +25,12 @@ protected OffsetEncoding getEncodingTypeCompressed() {
     }
 
     @Override
-    public void encodeIncompleteOffset(final int rangeIndex) {
+    public void encodeIncompleteOffset(final long newBaseOffset, final int relativeOffset) {
         this.bytesBuffer.put((byte) 0);
     }
 
     @Override
-    public void encodeCompletedOffset(final int rangeIndex) {
+    public void encodeCompletedOffset(final long newBaseOffset, final int relativeOffset) {
         this.bytesBuffer.put((byte) 1);
     }
 
@@ -38,6 +38,26 @@ public void encodeCompletedOffset(final int rangeIndex) {
     public byte[] serialise() {
         return this.bytesBuffer.array();
     }
+//
+//    @Override
+//    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset) {
+//sdf
+//    }
+//
+//    @Override
+//    public void encodeCompletedOffset(final long baseOffset, final long relativeOffset) {
+//sdf
+//    }
+
+    @Override
+    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+
+    }
+
+    @Override
+    public void encodeCompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+
+    }
 
     @Override
     public int getEncodedSize() {
@@ -45,7 +65,17 @@ public int getEncodedSize() {
     }
 
     @Override
-    protected byte[] getEncodedBytes() {
+    public int getEncodedSizeEstimate() {
+        return this.bytesBuffer.capacity();
+    }
+
+    @Override
+    public void maybeReinitialise(final long newBaseOffset, final long currentHighestCompleted) {
+        throw new InternalRuntimeError("Na");
+    }
+
+    @Override
+    public byte[] getEncodedBytes() {
         return this.bytesBuffer.array();
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
index b690ebbe9..69acc4824 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerManager.java
@@ -1,54 +1,81 @@
 package io.confluent.parallelconsumer;
 
-import lombok.RequiredArgsConstructor;
+import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.*;
+import org.apache.kafka.clients.consumer.internals.ConsumerCoordinator;
 import org.apache.kafka.common.TopicPartition;
 import org.apache.kafka.common.errors.WakeupException;
 import pl.tlinkowski.unij.api.UniMaps;
 
+import java.lang.reflect.Field;
 import java.time.Duration;
+import java.util.Collection;
+import java.util.List;
 import java.util.Map;
 import java.util.Set;
+import java.util.concurrent.Callable;
+import java.util.concurrent.Semaphore;
 import java.util.concurrent.atomic.AtomicBoolean;
+import java.util.concurrent.locks.Lock;
+import java.util.concurrent.locks.ReentrantLock;
+import java.util.regex.Pattern;
+import java.util.stream.Collectors;
 
 /**
  * Delegate for {@link KafkaConsumer}
+ * <p>
+ * Also wrapped for thread saftey.
  */
 @Slf4j
-@RequiredArgsConstructor
-public class ConsumerManager<K, V> {
+//@RequiredArgsConstructor
+public class ConsumerManager<K, V> implements AutoCloseable {
 
     private final Consumer<K, V> consumer;
 
+    //    private final Semaphore consumerLock = new Semaphore(1);
+    private final ReentrantLock consumerLock = new ReentrantLock(true);
+
     private final AtomicBoolean pollingBroker = new AtomicBoolean(false);
+//    private final ConsumerOffsetCommitter<K, V> consumerCommitter;
 
     private int erroneousWakups = 0;
     private int correctPollWakeups = 0;
     private int noWakeups = 0;
     private boolean commitRequested;
 
+    public ConsumerManager(final Consumer<K, V> consumer
+//            ,
+//                           final ConsumerOffsetCommitter<K, V> consumerCommitter,
+//                           final ParallelConsumerOptions options
+    ) {
+        this.consumer = consumer;
+//        this.consumerCommitter = consumerCommitter;
+    }
+
     ConsumerRecords<K, V> poll(Duration requestedLongPollTimeout) {
-        Duration timeoutToUse = requestedLongPollTimeout;
-        ConsumerRecords<K, V> records;
-        try {
-            if (commitRequested) {
-                log.debug("Commit requested, so will not long poll as need to perform the commit");
-                timeoutToUse = Duration.ofMillis(1);// disable long poll, as commit needs performing
-                commitRequested = false;
+        return doWithConsumer(() -> {
+            Duration timeoutToUse = requestedLongPollTimeout;
+            ConsumerRecords<K, V> records;
+            try {
+                if (commitRequested) {
+                    log.debug("Commit requested, so will not long poll as need to perform the commit");
+                    timeoutToUse = Duration.ofMillis(1);// disable long poll, as commit needs performing
+                    commitRequested = false;
+                }
+                pollingBroker.set(true);
+                records = consumer.poll(timeoutToUse);
+                log.debug("Poll completed normally and returned {}...", records.count());
+            } catch (WakeupException w) {
+                correctPollWakeups++;
+                log.debug("Awoken from broker poll");
+                log.trace("Wakeup caller is:", w);
+                records = new ConsumerRecords<>(UniMaps.of());
+            } finally {
+                pollingBroker.set(false);
             }
-            pollingBroker.set(true);
-            records = consumer.poll(timeoutToUse);
-            log.debug("Poll completed normally and returned {}...", records.count());
-        } catch (WakeupException w) {
-            correctPollWakeups++;
-            log.debug("Awoken from broker poll");
-            log.trace("Wakeup caller is:", w);
-            records = new ConsumerRecords<>(UniMaps.of());
-        } finally {
-            pollingBroker.set(false);
-        }
-        return records;
+            return records;
+        });
     }
 
     /**
@@ -61,17 +88,50 @@ public void wakeup() {
         // if the call to wakeup happens /after/ the check for a wake up state inside #poll, then the next call will through the wake up exception (i.e. #commit)
         if (pollingBroker.get()) {
             log.debug("Waking up consumer");
+//            doWithConsumer(consumer::wakeup);
             consumer.wakeup();
         }
     }
 
+//    Thread consumerWrapThread = new Thread();
+
+    private void doWithConsumer(final Runnable o) {
+        try {
+            aquireLock();
+        } catch (InterruptedException e) {
+            throw new InternalRuntimeError("Error locking consumer", e);
+        }
+        try {
+            o.run();
+        } catch (Exception exception) {
+            throw new InternalRuntimeError("Unknown", exception);
+        } finally {
+            releaseLock();
+        }
+    }
+
+    private <R> R doWithConsumer(final Callable<R> o) {
+        try {
+            aquireLock();
+        } catch (InterruptedException e) {
+            throw new InternalRuntimeError("Error locking consumer", e);
+        }
+        try {
+            return o.call();
+        } catch (Exception exception) {
+            throw new InternalRuntimeError("Unknown", exception);
+        } finally {
+            releaseLock();
+        }
+    }
+
     public void commitSync(final Map<TopicPartition, OffsetAndMetadata> offsetsToSend) {
         // we dont' want to be woken up during a commit, only polls
         boolean inProgress = true;
         noWakeups++;
         while (inProgress) {
             try {
-                consumer.commitSync(offsetsToSend);
+                doWithConsumer(() -> consumer.commitSync(offsetsToSend));
                 inProgress = false;
             } catch (WakeupException w) {
                 log.debug("Got woken up, retry. errors: " + erroneousWakups + " none: " + noWakeups + " correct:" + correctPollWakeups, w);
@@ -86,7 +146,11 @@ public void commitAsync(Map<TopicPartition, OffsetAndMetadata> offsets, OffsetCo
         noWakeups++;
         while (inProgress) {
             try {
-                consumer.commitAsync(offsets, callback);
+//                List<Thread> collect = Thread.getAllStackTraces().keySet().stream().filter(x -> x.getId() == 46L).collect(Collectors.toList());
+//                log.info("46:{}, {}", collect.get(0), consumerLock.isHeldByCurrentThread());
+                doWithConsumer(() ->
+                        consumer.commitAsync(offsets, callback)
+                );
                 inProgress = false;
             } catch (WakeupException w) {
                 log.debug("Got woken up, retry. errors: " + erroneousWakups + " none: " + noWakeups + " correct:" + correctPollWakeups, w);
@@ -96,30 +160,109 @@ public void commitAsync(Map<TopicPartition, OffsetAndMetadata> offsets, OffsetCo
     }
 
     public ConsumerGroupMetadata groupMetadata() {
-        return consumer.groupMetadata();
+        return doWithConsumer(consumer::groupMetadata);
     }
 
     public void close(final Duration defaultTimeout) {
-        consumer.close(defaultTimeout);
+        doWithConsumer(() -> consumer.close(defaultTimeout));
     }
 
     public Set<TopicPartition> assignment() {
-        return consumer.assignment();
+        return doWithConsumer(consumer::assignment);
     }
 
     public void pause(final Set<TopicPartition> assignment) {
-        consumer.pause(assignment);
+        doWithConsumer(() -> consumer.pause(assignment));
     }
 
     public Set<TopicPartition> paused() {
-        return consumer.paused();
+        return doWithConsumer(consumer::paused);
     }
 
     public void resume(final Set<TopicPartition> pausedTopics) {
-        consumer.resume(pausedTopics);
+        doWithConsumer(() -> consumer.resume(pausedTopics));
+    }
+
+
+    /**
+     * Nasty reflection to check if auto commit is disabled.
+     * <p>
+     * Other way would be to politely request the user also include their consumer properties when construction, but
+     * this is more reliable in a correctness sense, but britle in terms of coupling to internal implementation.
+     * Consider requesting ability to inspect configuration at runtime.
+     */
+    @SneakyThrows
+    public void checkAutoCommitIsDisabled() {
+//        doWithConsumer(() -> {
+        if (consumer instanceof KafkaConsumer) {
+            // Commons lang FieldUtils#readField - avoid needing commons lang
+            Field coordinatorField = consumer.getClass().getDeclaredField("coordinator"); //NoSuchFieldException
+            coordinatorField.setAccessible(true);
+            ConsumerCoordinator coordinator = (ConsumerCoordinator) coordinatorField.get(consumer); //IllegalAccessException
+
+            Field autoCommitEnabledField = coordinator.getClass().getDeclaredField("autoCommitEnabled");
+            autoCommitEnabledField.setAccessible(true);
+            Boolean isAutoCommitEnabled = (Boolean) autoCommitEnabledField.get(coordinator);
+
+            if (isAutoCommitEnabled)
+                throw new IllegalStateException("Consumer auto commit must be disabled, as commits are handled by the library.");
+        } else {
+            // noop - probably MockConsumer being used in testing - which doesn't do auto commits
+        }
+//        });
     }
 
     public void onCommitRequested() {
         this.commitRequested = true;
     }
+    public void checkNotSubscribed() {
+        if (consumer instanceof MockConsumer)
+            // disabled for unit tests which don't test rebalancing
+            return;
+        doWithConsumer(() -> {
+            Set<String> subscription = consumer.subscription();
+            Set<TopicPartition> assignment = consumer.assignment();
+
+            if (!subscription.isEmpty() || !assignment.isEmpty()) {
+                throw new IllegalStateException("Consumer subscription must be managed by this class. Use " + this.getClass().getName() + "#subcribe methods instead.");
+            }
+        });
+    }
+
+    //    @Override
+    public void subscribe(Collection<String> topics, ConsumerRebalanceListener callback) {
+        log.debug("Subscribing to {}", topics);
+        doWithConsumer(() -> consumer.subscribe(topics, callback));
+    }
+
+    //    @Override
+    public void subscribe(Pattern pattern, ConsumerRebalanceListener callback) {
+        log.debug("Subscribing to {}", pattern);
+        doWithConsumer(() -> consumer.subscribe(pattern, callback));
+    }
+
+    public Map<TopicPartition, OffsetAndMetadata> committed(final Set<TopicPartition> assignment) {
+        return consumer.committed(assignment);
+    }
+
+    void aquireLock() throws InterruptedException {
+        log.debug("Locking");
+//        if (consumerLock.tryLock()) {
+        wakeup();
+        consumerLock.lock();
+//        } else {
+//            throw new InternalRuntimeError("Deadlock");
+//        }
+    }
+
+    void releaseLock() {
+        log.debug("Unlocking");
+        consumerLock.unlock();
+    }
+
+    @Override
+    public void close() throws Exception {
+//        releaseLock();
+        consumer.close();
+    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java
index 61c747652..0bb6bb229 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ConsumerOffsetCommitter.java
@@ -133,8 +133,8 @@ private boolean isOwner() {
 
     private void signalCommitPerformed() {
         log.debug("Starting Signaling commit finished");
-        if (!commitLock.isHeldByCurrentThread())
-            throw new IllegalStateException("Lock already held");
+//        if (!commitLock.isHeldByCurrentThread())
+//            throw new IllegalStateException("Lock already held");
         commitLock.lock();
         try {
             commitCount.incrementAndGet();
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/EncodedOffsetPair.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/EncodedOffsetData.java
similarity index 93%
rename from parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/EncodedOffsetPair.java
rename to parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/EncodedOffsetData.java
index 58922d3c9..596f2e405 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/EncodedOffsetPair.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/EncodedOffsetData.java
@@ -25,7 +25,7 @@
  * @see #unwrap
  */
 @Slf4j
-final class EncodedOffsetPair implements Comparable<EncodedOffsetPair> {
+final class EncodedOffsetData implements Comparable<EncodedOffsetData> {
 
     @Getter
     OffsetEncoding encoding;
@@ -35,13 +35,13 @@ final class EncodedOffsetPair implements Comparable<EncodedOffsetPair> {
     /**
      * @see #unwrap
      */
-    EncodedOffsetPair(OffsetEncoding encoding, ByteBuffer data) {
+    EncodedOffsetData(OffsetEncoding encoding, ByteBuffer data) {
         this.encoding = encoding;
         this.data = data;
     }
 
     @Override
-    public int compareTo(EncodedOffsetPair o) {
+    public int compareTo(EncodedOffsetData o) {
         return Integer.compare(data.capacity(), o.getData().capacity());
     }
 
@@ -67,13 +67,13 @@ private static byte[] copyBytesOutOfBufferForDebug(ByteBuffer bbData) {
         return bytes;
     }
 
-    static EncodedOffsetPair unwrap(byte[] input) {
+    static EncodedOffsetData unwrap(byte[] input) {
         ByteBuffer wrap = ByteBuffer.wrap(input).asReadOnlyBuffer();
         byte magic = wrap.get();
         OffsetEncoding decode = decode(magic);
         ByteBuffer slice = wrap.slice();
 
-        return new EncodedOffsetPair(decode, slice);
+        return new EncodedOffsetData(decode, slice);
     }
 
     @SneakyThrows
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
new file mode 100644
index 000000000..ec186ed7b
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ExponentialMovingAverage.java
@@ -0,0 +1,21 @@
+package io.confluent.parallelconsumer;
+
+public class ExponentialMovingAverage {
+
+    private double alpha;
+    private Double oldValue;
+
+    public ExponentialMovingAverage(double alpha) {
+        this.alpha = alpha;
+    }
+
+    public double average(double value) {
+        if (oldValue == null) {
+            oldValue = value;
+            return value;
+        }
+        double newValue = oldValue + alpha * (value - oldValue);
+        oldValue = newValue;
+        return newValue;
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/InternalRuntimeError.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/InternalRuntimeError.java
index 69e023fb1..e86762d72 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/InternalRuntimeError.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/InternalRuntimeError.java
@@ -1,5 +1,7 @@
 package io.confluent.parallelconsumer;
 
+import static io.confluent.csid.utils.StringUtils.msg;
+
 public class InternalRuntimeError extends RuntimeException {
 
     public InternalRuntimeError(final String message) {
@@ -10,6 +12,10 @@ public InternalRuntimeError(final String message, final Throwable cause) {
         super(message, cause);
     }
 
+    public InternalRuntimeError(final String message, Object... args) {
+        super(msg(message, args));
+    }
+
     public InternalRuntimeError(final Throwable cause) {
         super(cause);
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetBitSet.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetBitSet.java
index 5c68a1bf4..392f655a0 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetBitSet.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetBitSet.java
@@ -28,7 +28,7 @@ static String deserialiseBitSetWrap(ByteBuffer wrap, OffsetEncoding.Version vers
         wrap.rewind();
 
         int originalBitsetSize = switch (version) {
-            case v1 -> (int)wrap.getShort(); // up cast ok
+            case v1 -> (int) wrap.getShort(); // up cast ok
             case v2 -> wrap.getInt();
         };
 
@@ -53,24 +53,24 @@ static String deserialiseBitSet(int originalBitsetSize, ByteBuffer s) {
 
     static Tuple<Long, Set<Long>> deserialiseBitSetWrapToIncompletes(OffsetEncoding encoding, long baseOffset, ByteBuffer wrap) {
         wrap.rewind();
-        int originalBitsetSize = switch(encoding) {
+        int originalBitsetSize = switch (encoding) {
             case BitSet -> wrap.getShort();
             case BitSetV2 -> wrap.getInt();
             default -> throw new InternalRuntimeError("Invalid state");
         };
         ByteBuffer slice = wrap.slice();
         Set<Long> incompletes = deserialiseBitSetToIncompletes(baseOffset, originalBitsetSize, slice);
-        long highwaterMark = baseOffset + originalBitsetSize;
-        return Tuple.pairOf(highwaterMark, incompletes);
+        long highestSeenRecord = baseOffset + originalBitsetSize;
+        return Tuple.pairOf(highestSeenRecord, incompletes);
     }
 
     static Set<Long> deserialiseBitSetToIncompletes(long baseOffset, int originalBitsetSize, ByteBuffer inputBuffer) {
-        BitSet bitSet = BitSet.valueOf(inputBuffer);
+        BitSet bitSetOfSucceededRecords = BitSet.valueOf(inputBuffer);
         var incompletes = new HashSet<Long>(); // can't know how big this needs to be yet
         for (var relativeOffset : range(originalBitsetSize)) {
             long offset = baseOffset + relativeOffset;
-            if (bitSet.get(relativeOffset)) {
-                log.trace("Ignoring completed offset");
+            if (bitSetOfSucceededRecords.get(relativeOffset)) {
+                log.trace("Ignoring completed offset relative {} offset {}", relativeOffset, offset);
             } else {
                 incompletes.add(offset);
             }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoder.java
deleted file mode 100644
index d8a062dd5..000000000
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoder.java
+++ /dev/null
@@ -1,61 +0,0 @@
-package io.confluent.parallelconsumer;
-
-import lombok.SneakyThrows;
-import lombok.extern.slf4j.Slf4j;
-
-import java.io.IOException;
-import java.nio.ByteBuffer;
-
-/**
- * Base OffsetEncoder
- */
-@Slf4j
-abstract class OffsetEncoder {
-
-    private final OffsetSimultaneousEncoder offsetSimultaneousEncoder;
-
-    public OffsetEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
-        this.offsetSimultaneousEncoder = offsetSimultaneousEncoder;
-    }
-
-    protected abstract OffsetEncoding getEncodingType();
-
-    protected abstract OffsetEncoding getEncodingTypeCompressed();
-
-    abstract void encodeIncompleteOffset(final int rangeIndex);
-
-    abstract void encodeCompletedOffset(final int rangeIndex);
-
-    abstract byte[] serialise() throws EncodingNotSupportedException;
-
-    abstract int getEncodedSize();
-
-    boolean quiteSmall() {
-        return this.getEncodedSize() < OffsetSimultaneousEncoder.LARGE_INPUT_MAP_SIZE_THRESHOLD;
-    }
-
-    byte[] compress() throws IOException {
-        return OffsetSimpleSerialisation.compressZstd(this.getEncodedBytes());
-    }
-
-    void register() throws EncodingNotSupportedException {
-        final byte[] bytes = this.serialise();
-        final OffsetEncoding encodingType = this.getEncodingType();
-        this.register(encodingType, bytes);
-    }
-
-    private void register(final OffsetEncoding type, final byte[] bytes) {
-        log.debug("Registering {}, with site {}", type, bytes.length);
-        offsetSimultaneousEncoder.sortedEncodings.add(new EncodedOffsetPair(type, ByteBuffer.wrap(bytes)));
-        offsetSimultaneousEncoder.encodingMap.put(type, bytes);
-    }
-
-    @SneakyThrows
-    void registerCompressed() {
-        final byte[] compressed = compress();
-        final OffsetEncoding encodingType = this.getEncodingTypeCompressed();
-        this.register(encodingType, compressed);
-    }
-
-    protected abstract byte[] getEncodedBytes();
-}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderBase.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderBase.java
new file mode 100644
index 000000000..e516e5d2c
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderBase.java
@@ -0,0 +1,148 @@
+package io.confluent.parallelconsumer;
+
+import lombok.SneakyThrows;
+import lombok.ToString;
+import lombok.extern.slf4j.Slf4j;
+
+import java.io.IOException;
+import java.nio.ByteBuffer;
+
+
+/**
+ * Base OffsetEncoder
+ * <p>
+ * When encoding offset data beyond the low water mark, we only need to record information up until the highest
+ * succeeded offset, as any beyond (because they have failed or haven't suceeded yet) we can treat as though we've never
+ * seen them when we come across them again.
+ *
+ * @see WorkManager
+ */
+@ToString(onlyExplicitlyIncluded = true)
+@Slf4j
+abstract class OffsetEncoderBase implements OffsetEncoderContract, Comparable<OffsetEncoderBase> {
+
+    private final OffsetSimultaneousEncoder offsetSimultaneousEncoder;
+
+    @ToString.Include
+    private boolean disabled = false;
+
+    /**
+     * The highest committable offset - the next expected offset to be returned by the broker. So by definition, this
+     * index in our offset map we're encoding, is always incomplete.
+     */
+    @ToString.Include
+    protected long originalBaseOffset;
+
+    public OffsetEncoderBase(final long baseOffset, OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
+        this.originalBaseOffset = baseOffset;
+        this.offsetSimultaneousEncoder = offsetSimultaneousEncoder;
+    }
+
+    protected abstract OffsetEncoding getEncodingType();
+
+    protected abstract OffsetEncoding getEncodingTypeCompressed();
+
+    public abstract void encodeIncompleteOffset(final long newBaseOffset, final int relativeOffset);
+
+    public abstract void encodeCompletedOffset(final long newBaseOffset, final int relativeOffset);
+
+    abstract byte[] serialise() throws EncodingNotSupportedException;
+
+    public abstract int getEncodedSize();
+
+    boolean quiteSmall() {
+        return this.getEncodedSize() < OffsetSimultaneousEncoder.LARGE_INPUT_MAP_SIZE_THRESHOLD;
+    }
+
+    byte[] compress() throws IOException {
+        return OffsetSimpleSerialisation.compressZstd(this.getEncodedBytes());
+    }
+
+    void registerSerialisedDataIfEnabled() { //throws EncodingNotSupportedException {
+        if (!disabled) {
+            final byte[] bytes;
+            try {
+                bytes = this.serialise();
+                final OffsetEncoding encodingType = this.getEncodingType();
+//            log.trace("Registering {} with size {}", getEncodingType(), bytes.length);
+                this.registerSerialisedData(encodingType, bytes);
+            } catch (EncodingNotSupportedException e) {
+                log.debug("Encoding not supported, disabling", e);
+                disable(e);
+            }
+        } else {
+            log.trace("{} disabled, not registering serialised data", this);
+        }
+    }
+
+    private void registerSerialisedData(final OffsetEncoding type, final byte[] bytes) {
+        int encodedSizeEstimate = getEncodedSizeEstimate();
+        int length = bytes.length;
+        log.debug("Registering {}, with actual size {} vs estimate {}", type, length, encodedSizeEstimate);
+        offsetSimultaneousEncoder.sortedEncodingData.add(new EncodedOffsetData(type, ByteBuffer.wrap(bytes)));
+        offsetSimultaneousEncoder.encodingMap.put(type, bytes);
+    }
+
+    @SneakyThrows
+    void registerCompressed() {
+        final byte[] compressed = compress();
+        final OffsetEncoding encodingType = this.getEncodingTypeCompressed();
+        this.registerSerialisedData(encodingType, compressed);
+    }
+
+    public abstract byte[] getEncodedBytes();
+
+//    @Override
+//    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+////        if (baseOffset != this.baseOffset) {
+////            throw new InternalRuntimeError("Inconsistent");
+////        }
+//
+//        int castOffset = (int) relativeOffset;
+//        if (castOffset != relativeOffset)
+//            throw new IllegalArgumentException("Interger overflow");
+//
+//        encodeIncompleteOffset(castOffset);
+//    }
+
+//    @Override
+//    public void encodeCompletedOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+//        if (baseOffset != this.baseOffset) {
+//            throw new InternalRuntimeError("Na");
+//        }
+//        int castOffset = (int) relativeOffset;
+//        if (castOffset != relativeOffset)
+//            throw new IllegalArgumentException("Interger overflow");
+//
+//        encodeCompletedOffset(castOffset);
+//    }
+
+    /**
+     * Compared with returned encoding size
+     * <p>
+     * Note: this class has a natural ordering that is inconsistent with equals.
+     *
+     * @see #getEncodedSize()
+     */
+    @Override
+    public int compareTo(final OffsetEncoderBase e) {
+        return Integer.compare(this.getEncodedSizeEstimate(), e.getEncodedSizeEstimate());
+    }
+
+    public void disable(final EncodingNotSupportedException e) {
+        disabled = true;
+        log.debug("Disabling {}, {}", this.getEncodingType(), e.getMessage(), e);
+    }
+
+    public void enable() {
+        disabled = false;
+    }
+
+    public boolean canEncoderBeUsed() {
+        return !disabled;
+    }
+
+    public boolean isEncoderNeeded() {
+        return !disabled;
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderContract.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderContract.java
new file mode 100644
index 000000000..296c9659d
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoderContract.java
@@ -0,0 +1,29 @@
+package io.confluent.parallelconsumer;
+
+public interface OffsetEncoderContract {
+
+    /**
+     * TODO this method isnt' actually used by any encoder
+     * @param baseOffset need the baseOffset also, as it may change with new success (highest committable may rise)
+     * @param relativeOffset Offset relative to the base offset (e.g. offset - baseOffset)
+     */
+    void encodeIncompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted);
+
+    /**
+     * @param baseOffset need the baseOffset also, as it may change with new success (highest committable may rise)
+     * @param relativeOffset Offset relative to the base offset (e.g. offset - baseOffset)
+     */
+    void encodeCompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted);
+
+    int getEncodedSize();
+
+    byte[] getEncodedBytes();
+
+    /**
+     * Used for comparing encoders
+     */
+    int getEncodedSizeEstimate();
+
+    void maybeReinitialise(final long newBaseOffset, final long currentHighestCompleted) throws EncodingNotSupportedException;
+
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoding.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoding.java
index 94853d8c9..eaee898ac 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoding.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetEncoding.java
@@ -36,12 +36,17 @@ enum OffsetEncoding {
     RunLengthV2(v2, (byte) 'e'),
     RunLengthV2Compressed(v2, (byte) 'p');
 
+    public static int standardOverhead = Byte.BYTES;
+
     enum Version {
         v1, v2
     }
 
     public final Version version;
 
+    /**
+     * Single byte to show which encoding is being used
+     */
     @Getter
     public final byte magicByte;
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java
index ff478f93b..1f6245c04 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetMapCodecManager.java
@@ -42,13 +42,13 @@ public class OffsetMapCodecManager<K, V> {
      * @see <a href="https://github.com/apache/kafka/blob/9bc9a37e50e403a356a4f10d6df12e9f808d4fba/core/src/main/scala/kafka/coordinator/group/OffsetConfig.scala#L52">OffsetConfig#DefaultMaxMetadataSize</a>
      * @see "kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize"
      */
-    public static final int DefaultMaxMetadataSize = 4096;
+    static int DefaultMaxMetadataSize = 4096;
 
     public static final Charset CHARSET_TO_USE = UTF_8;
 
     private final WorkManager<K, V> wm;
 
-    org.apache.kafka.clients.consumer.Consumer<K, V> consumer;
+    ConsumerManager<K, V> consumer;
 
     @Value
     static class NextOffsetAndIncompletes {
@@ -65,7 +65,7 @@ public static NextOffsetAndIncompletes of(long nextExpectedOffset, Set<Long> inc
      */
     static Optional<OffsetEncoding> forcedCodec = Optional.empty();
 
-    public OffsetMapCodecManager(final WorkManager<K, V> wm, final org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
+    public OffsetMapCodecManager(final WorkManager<K, V> wm, final ConsumerManager<K, V> consumer) {
         this.wm = wm;
         this.consumer = consumer;
     }
@@ -109,45 +109,59 @@ static NextOffsetAndIncompletes deserialiseIncompleteOffsetMapFromBase64(long fi
 
     void loadOffsetMetadataPayload(long startOffset, TopicPartition tp, String offsetMetadataPayload) throws OffsetDecodingError {
         NextOffsetAndIncompletes incompletes = deserialiseIncompleteOffsetMapFromBase64(startOffset, offsetMetadataPayload);
-        wm.raisePartitionHighWaterMark(incompletes.getNextExpectedOffset(), tp);
+        wm.raisePartitionHighestSeen(incompletes.getNextExpectedOffset(), tp);
         Set<Long> incompleteOffsets = incompletes.getIncompleteOffsets();
-        wm.partitionIncompleteOffsets.put(tp, incompleteOffsets);
+        wm.partitionOffsetsIncompleteMetadataPayloads.put(tp, incompleteOffsets);
         log.warn("Loaded incomplete offsets from offset metadata {}", incompleteOffsets);
     }
 
-    String makeOffsetMetadataPayload(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) throws EncodingNotSupportedException {
-        String offsetMap = serialiseIncompleteOffsetMapToBase64(finalOffsetForPartition, tp, incompleteOffsets);
-        return offsetMap;
-    }
+//    String makeOffsetMetadataPayload(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) throws EncodingNotSupportedException {
+//        String offsetMap = serialiseIncompleteOffsetMapToBase64(finalOffsetForPartition, tp, incompleteOffsets);
+//        return offsetMap;
+//    }
 
-    String serialiseIncompleteOffsetMapToBase64(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) throws EncodingNotSupportedException {
-        byte[] compressedEncoding = encodeOffsetsCompressed(finalOffsetForPartition, tp, incompleteOffsets);
-        String b64 = OffsetSimpleSerialisation.base64(compressedEncoding);
-        return b64;
+    String makeOffsetMetadataPayload(OffsetSimultaneousEncoder simultaneousEncoder) throws EncodingNotSupportedException {
+        byte[] smallest = packSmallest(simultaneousEncoder);
+        String offsetMap = OffsetSimpleSerialisation.base64(smallest);
+        return offsetMap;
     }
 
-    /**
-     * Print out all the offset status into a String, and use X to effectively do run length encoding compression on the
-     * string.
-     * <p>
-     * Include the magic byte in the returned array.
-     * <p>
-     * Can remove string encoding in favour of the boolean array for the `BitSet` if that's how things settle.
-     */
-    byte[] encodeOffsetsCompressed(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) throws EncodingNotSupportedException {
-        Long nextExpectedOffset = wm.partitionOffsetHighWaterMarks.get(tp) + 1;
-        OffsetSimultaneousEncoder simultaneousEncoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, nextExpectedOffset, incompleteOffsets).invoke();
+//    String serialiseIncompleteOffsetMapToBase64(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) throws EncodingNotSupportedException {
+//        byte[] compressedEncoding = encodeOffsetsCompressed(finalOffsetForPartition, tp, incompleteOffsets);
+//        String b64 = OffsetSimpleSerialisation.base64(compressedEncoding);
+//        return b64;
+//    }
+
+//    /**
+//     * Print out all the offset status into a String, and use X to effectively do run length encoding compression on the
+//     * string.
+//     * <p>
+//     * Include the magic byte in the returned array.
+//     * <p>
+//     * Can remove string encoding in favour of the boolean array for the `BitSet` if that's how things settle.
+//     */
+//    byte[] encodeOffsetsCompressed(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) throws EncodingNotSupportedException {
+//        Long currentHighestCompleted = wm.partitionOffsetHighestSeen.get(tp) + 1; // this is a problem - often the highest succeeded is very different from highest seet
+//        // todo use new encoder for accuracy
+//        OffsetSimultaneousEncoder simultaneousEncoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, currentHighestCompleted)
+//                .runOverIncompletes(incompleteOffsets, finalOffsetForPartition, currentHighestCompleted);
+//        return packSmallest(simultaneousEncoder);
+//    }
+
+    private byte[] packSmallest(final OffsetSimultaneousEncoder simultaneousEncoder) throws EncodingNotSupportedException {
+        byte[] result;
         if (forcedCodec.isPresent()) {
             OffsetEncoding forcedOffsetEncoding = forcedCodec.get();
-            log.warn("Forcing use of {}, for testing", forcedOffsetEncoding);
+            log.debug("Forcing use of {}, for testing", forcedOffsetEncoding);
             Map<OffsetEncoding, byte[]> encodingMap = simultaneousEncoder.getEncodingMap();
             byte[] bytes = encodingMap.get(forcedOffsetEncoding);
             if (bytes == null)
                 throw new EncodingNotSupportedException(msg("Can't force an encoding that hasn't been run: {}", forcedOffsetEncoding));
-            return simultaneousEncoder.packEncoding(new EncodedOffsetPair(forcedOffsetEncoding, ByteBuffer.wrap(bytes)));
+            result = simultaneousEncoder.packEncoding(new EncodedOffsetData(forcedOffsetEncoding, ByteBuffer.wrap(bytes)));
         } else {
-            return simultaneousEncoder.packSmallest();
+            result = simultaneousEncoder.packSmallest();
         }
+        return result;
     }
 
     /**
@@ -162,21 +176,21 @@ static NextOffsetAndIncompletes decodeCompressedOffsets(long finalOffsetForParti
             return NextOffsetAndIncompletes.of(finalOffsetForPartition, UniSets.of());
         }
 
-        EncodedOffsetPair result = EncodedOffsetPair.unwrap(decodedBytes);
+        EncodedOffsetData result = EncodedOffsetData.unwrap(decodedBytes);
 
         ParallelConsumer.Tuple<Long, Set<Long>> incompletesTuple = result.getDecodedIncompletes(finalOffsetForPartition);
 
         Set<Long> incompletes = incompletesTuple.getRight();
-        long highWater = incompletesTuple.getLeft();
+        long nextExpectedOffset = incompletesTuple.getLeft();
 
-        return NextOffsetAndIncompletes.of(highWater, incompletes);
+        return NextOffsetAndIncompletes.of(nextExpectedOffset, incompletes);
     }
 
     String incompletesToBitmapString(long finalOffsetForPartition, TopicPartition tp, Set<Long> incompleteOffsets) {
         StringBuilder runLengthString = new StringBuilder();
         Long lowWaterMark = finalOffsetForPartition;
-        Long highWaterMark = wm.partitionOffsetHighWaterMarks.get(tp);
-        long end = highWaterMark - lowWaterMark;
+        Long highestSeen = wm.partitionOffsetHighestSeen.get(tp);  // this is a problem - often the highest succeeded is very different from highest seet
+        long end = highestSeen - lowWaterMark;
         for (final var relativeOffset : range(end)) {
             long offset = lowWaterMark + relativeOffset;
             if (incompleteOffsets.contains(offset)) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimpleSerialisation.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimpleSerialisation.java
index 115bff37a..774a731c8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimpleSerialisation.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimpleSerialisation.java
@@ -84,7 +84,7 @@ static byte[] compressGzip(final byte[] bytes) throws IOException {
     static String base64(final byte[] src) {
         final byte[] encode = Base64.getEncoder().encode(src);
         final String out = new String(encode, OffsetMapCodecManager.CHARSET_TO_USE);
-        log.trace("Final b64 size: {}", out.length());
+        log.trace("Final base 64 wrapped encoded string length: {}", out.length());
         return out;
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java
index cb0533740..4cc69ba2c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoder.java
@@ -5,12 +5,14 @@
  */
 
 import lombok.Getter;
+import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 
 import java.nio.ByteBuffer;
 import java.util.*;
 
 import static io.confluent.csid.utils.Range.range;
+import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.OffsetEncoding.Version.v1;
 import static io.confluent.parallelconsumer.OffsetEncoding.Version.v2;
 
@@ -22,7 +24,7 @@
  * @see #invoke()
  */
 @Slf4j
-class OffsetSimultaneousEncoder {
+class OffsetSimultaneousEncoder implements OffsetEncoderContract {
 
     /**
      * Size threshold in bytes after which compressing the encodings will be compared, as it seems to be typically worth
@@ -30,26 +32,25 @@ class OffsetSimultaneousEncoder {
      */
     public static final int LARGE_INPUT_MAP_SIZE_THRESHOLD = 200;
 
-    /**
-     * The offsets which have not yet been fully completed and can't have their offset committed
-     */
-    @Getter
-    private final Set<Long> incompleteOffsets;
+//    /**
+//     * The offsets which have not yet been fully completed and can't have their offset committed
+//     */
+//    @Getter
+//    private final Set<Long> incompleteOffsets;
 
     /**
-     * The lowest committable offset
+     * The highest committable offset - the next expected offset to be returned by the broker. So by definition, this
+     * index in our offset map we're encoding, is always incomplete.
      */
-    private final long lowWaterMark;
+    @Getter
+    private long baseOffset;
 
-    /**
-     * The next expected offset to be returned by the broker
-     */
-    private final long nextExpectedOffset;
+    private long highestSucceeded;
 
     /**
      * The difference between the base offset (the offset to be committed) and the highest seen offset
      */
-    private final int length;
+    private int length;
 
     /**
      * Map of different encoding types for the same offset data, used for retrieving the data for the encoding type
@@ -63,8 +64,7 @@ class OffsetSimultaneousEncoder {
      * @see #packSmallest()
      */
     @Getter
-    PriorityQueue<EncodedOffsetPair> sortedEncodings = new PriorityQueue();
-
+    PriorityQueue<EncodedOffsetData> sortedEncodingData = new PriorityQueue();
 
     /**
      * Force the encoder to also add the compressed versions. Useful for testing.
@@ -76,40 +76,95 @@ class OffsetSimultaneousEncoder {
     /**
      * The encoders to run
      */
-    private final Set<OffsetEncoder> encoders = new HashSet<>();
+    // TODO do we really need both views?
+    final HashSet<OffsetEncoderBase> encoders = new HashSet<>();
+    final List<OffsetEncoderBase> sortedEncoders = new ArrayList<>();
 
-    public OffsetSimultaneousEncoder(long lowWaterMark, Long nextExpectedOffset, Set<Long> incompleteOffsets) {
-        this.lowWaterMark = lowWaterMark;
-        this.nextExpectedOffset = nextExpectedOffset;
-        this.incompleteOffsets = incompleteOffsets;
+    /**
+     * @param lowWaterMark The highest committable offset
+     */
+    public OffsetSimultaneousEncoder(
+            long lowWaterMark
+            ,
+            Long newHighestCompleted
+
+//            ,
+    ) {
+        if (lowWaterMark < 0)
+            lowWaterMark = 0;
+        if (newHighestCompleted < 0)
+            newHighestCompleted = 0L;
+//        this.incompleteOffsets = incompleteOffsets;
+
+        initialise(lowWaterMark, newHighestCompleted);
+
+        addEncoders();
+    }
 
-        long longLength = this.nextExpectedOffset - this.lowWaterMark;
-        length = (int) longLength;
+    private int initLength(long currentBaseOffset, long highestCompleted) {
+        long longLength = highestCompleted - currentBaseOffset;
+        int intLength = (int) longLength;
         // sanity
-        if (longLength != length) throw new IllegalArgumentException("Integer overflow");
-
-        initEncoders();
+        if (longLength != intLength)
+            throw new IllegalArgumentException("Casting inconsistency");
+        return intLength;
     }
 
-    private void initEncoders() {
+    //todo can remove sync?
+    private synchronized void initialise(final long currentBaseOffset, long currentHighestCompleted) {
+        log.trace("Initialising {},{}", currentBaseOffset, currentHighestCompleted);
+        this.baseOffset = currentBaseOffset;
+        this.highestSucceeded = currentHighestCompleted;
+
+        this.length = initLength(currentBaseOffset, highestSucceeded);
+
         if (length > LARGE_INPUT_MAP_SIZE_THRESHOLD) {
-            log.debug("~Large input map size: {} (start: {} end: {})", length, lowWaterMark, nextExpectedOffset);
+            log.debug("~Large input map size: {} (start: {} end: {})", length, this.baseOffset, this.highestSucceeded);
+        }
+    }
+
+    private void reinitEncoders(final long currentBaseOffset, final long currentHighestCompleted) {
+        log.debug("Reinitialise all encoders");
+        for (final OffsetEncoderBase encoder : encoders) {
+            try {
+                encoder.maybeReinitialise(currentBaseOffset, currentHighestCompleted);
+            } catch (EncodingNotSupportedException a) {
+                log.debug("Cannot use {} encoder with new base {} and highest {}: {}",
+                        encoder.getClass().getSimpleName(), currentBaseOffset, currentHighestCompleted, a.getMessage());
+                encoder.disable(a);
+            }
         }
+    }
+
+    private void addEncoders() {
+        // still need to register encoders?
+//        if (length < 1) {
+//            // won't need to encode anything
+//            return;
+//        } else {
+//            log.debug("Adding encoders");
+//        }
+
+//        if (!encoders.isEmpty()) {
+//            return;
+//        }
 
         try {
-            encoders.add(new BitsetEncoder(length, this, v1));
+            encoders.add(new BitsetEncoder(baseOffset, length, this, v1));
         } catch (BitSetEncodingNotSupportedException a) {
             log.debug("Cannot use {} encoder ({})", BitsetEncoder.class.getSimpleName(), a.getMessage());
         }
 
         try {
-            encoders.add(new BitsetEncoder(length, this, v2));
+            encoders.add(new BitsetEncoder(baseOffset, length, this, v2));
         } catch (BitSetEncodingNotSupportedException a) {
             log.warn("Cannot use {} encoder ({})", BitsetEncoder.class.getSimpleName(), a.getMessage());
         }
 
-        encoders.add(new RunLengthEncoder(this, v1));
-        encoders.add(new RunLengthEncoder(this, v2));
+        encoders.add(new RunLengthEncoder(baseOffset, this, v1));
+        encoders.add(new RunLengthEncoder(baseOffset, this, v2));
+
+        sortedEncoders.addAll(encoders);
     }
 
     /**
@@ -117,100 +172,112 @@ private void initEncoders() {
      * <p>
      * Visible for testing
      */
-    void addByteBufferEncoder() {
-        encoders.add(new ByteBufferEncoder(length, this));
+    void addByteBufferEncoder(long baseOffset) {
+        encoders.add(new ByteBufferEncoder(baseOffset, length, this));
     }
 
-    /**
-     * Highwater mark already encoded in string - {@link OffsetMapCodecManager#makeOffsetMetadataPayload} - so encoding
-     * BitSet run length may not be needed, or could be swapped
-     * <p/>
-     * Simultaneously encodes:
-     * <ul>
-     * <li>{@link OffsetEncoding#BitSet}</li>
-     * <li>{@link OffsetEncoding#RunLength}</li>
-     * </ul>
-     * Conditionaly encodes compression variants:
-     * <ul>
-     * <li>{@link OffsetEncoding#BitSetCompressed}</li>
-     * <li>{@link OffsetEncoding#RunLengthCompressed}</li>
-     * </ul>
-     * Currently commented out is {@link OffsetEncoding#ByteArray} as there doesn't seem to be an advantage over
-     * BitSet encoding.
-     * <p>
-     * TODO: optimisation - inline this into the partition iteration loop in {@link WorkManager}
-     * <p>
-     * TODO: optimisation - could double the run-length range from Short.MAX_VALUE (~33,000) to Short.MAX_VALUE * 2
-     *  (~66,000) by using unsigned shorts instead (higest representable relative offset is Short.MAX_VALUE because each
-     *  runlength entry is a Short)
-     * <p>
-     *  TODO VERY large offests ranges are slow (Integer.MAX_VALUE) - encoding scans could be avoided if passing in map of incompletes which should already be known
-     */
-    public OffsetSimultaneousEncoder invoke() {
-        log.debug("Starting encode of incompletes, base offset is: {}, end offset is: {}", lowWaterMark, nextExpectedOffset);
-        log.trace("Incompletes are: {}", this.incompleteOffsets);
-
-        //
-        log.debug("Encode loop offset start,end: [{},{}] length: {}", this.lowWaterMark, this.nextExpectedOffset, length);
-        /*
-         * todo refactor this loop into the encoders (or sequential vs non sequential encoders) as RunLength doesn't need
-         *  to look at every offset in the range, only the ones that change from 0 to 1. BitSet however needs to iterate
-         *  the entire range. So when BitSet can't be used, the encoding would be potentially a lot faster as RunLength
-         *  didn't need the whole loop.
-         */
-        range(length).forEach(rangeIndex -> {
-            final long offset = this.lowWaterMark + rangeIndex;
-            List<OffsetEncoder> removeToBeRemoved = new ArrayList<>();
-            if (this.incompleteOffsets.contains(offset)) {
-                log.trace("Found an incomplete offset {}", offset);
-                encoders.forEach(x -> {
-                    x.encodeIncompleteOffset(rangeIndex);
-                });
-            } else {
-                encoders.forEach(x -> {
-                    x.encodeCompletedOffset(rangeIndex);
-                });
-            }
-            encoders.removeAll(removeToBeRemoved);
-        });
-
-        registerEncodings(encoders);
-
-        log.debug("In order: {}", this.sortedEncodings);
-
-        return this;
-    }
-
-    private void registerEncodings(final Set<? extends OffsetEncoder> encoders) {
-        List<OffsetEncoder> toRemove = new ArrayList<>();
-        for (OffsetEncoder encoder : encoders) {
-            try {
-                encoder.register();
-            } catch (EncodingNotSupportedException e) {
-                log.debug("Removing {} encoder, not supported ({})", encoder.getEncodingType().description(), e.getMessage());
-                toRemove.add(encoder);
-            }
+//    /**
+//     * Highwater mark already encoded in string - {@link OffsetMapCodecManager#makeOffsetMetadataPayload} - so encoding
+//     * BitSet run length may not be needed, or could be swapped
+//     * <p/>
+//     * Simultaneously encodes:
+//     * <ul>
+//     * <li>{@link OffsetEncoding#BitSet}</li>
+//     * <li>{@link OffsetEncoding#RunLength}</li>
+//     * </ul>
+//     * Conditionaly encodes compression variants:
+//     * <ul>
+//     * <li>{@link OffsetEncoding#BitSetCompressed}</li>
+//     * <li>{@link OffsetEncoding#RunLengthCompressed}</li>
+//     * </ul>
+//     * Currently commented out is {@link OffsetEncoding#ByteArray} as there doesn't seem to be an advantage over
+//     * BitSet encoding.
+//     * <p>
+//     * TODO: optimisation - inline this into the partition iteration loop in {@link WorkManager}
+//     * <p>
+//     * TODO: optimisation - could double the run-length range from Short.MAX_VALUE (~33,000) to Short.MAX_VALUE * 2
+//     *  (~66,000) by using unsigned shorts instead (higest representable relative offset is Short.MAX_VALUE because each
+//     *  runlength entry is a Short)
+//     * <p>
+//     *  TODO VERY large offests ranges are slow (Integer.MAX_VALUE) - encoding scans could be avoided if passing in map of incompletes which should already be known
+//     *
+//     * @param currentBaseOffset       to use now, checked for consistency
+//     * @param currentHighestCompleted to use now, checked for consistency
+//     */
+//    public OffsetSimultaneousEncoder runOverIncompletes(Set<Long> incompleteOffsets, final long currentBaseOffset, final long currentHighestCompleted) {
+////        checkConditionsHaventChanged(currentBaseOffset, currentHighestCompleted);
+//
+//        log.debug("Starting encode of incompletes, base offset is: {}, end offset is: {}", baseOffset, highestSucceeded);
+//        log.trace("Incompletes are: {}", incompleteOffsets);
+//
+//        //
+//        log.debug("Encode loop offset start,end: [{},{}] length: {}", this.baseOffset, this.highestSucceeded, length);
+//        /*
+//         * todo refactor this loop into the encoders (or sequential vs non sequential encoders) as RunLength doesn't need
+//         *  to look at every offset in the range, only the ones that change from 0 to 1. BitSet however needs to iterate
+//         *  the entire range. So when BitSet can't be used, the encoding would be potentially a lot faster as RunLength
+//         *  didn't need the whole loop.
+//         */
+//        range(length).forEach(rangeIndex -> {
+//            final long offset = this.baseOffset + rangeIndex;
+//            if (incompleteOffsets.contains(offset)) {
+//                log.trace("Found an incomplete offset {}", offset);
+//                encoders.forEach(x -> {
+//                    x.encodeIncompleteOffset(currentBaseOffset, rangeIndex, currentHighestCompleted);
+//                });
+//            } else {
+//                encoders.forEach(x -> {
+//                    x.encodeCompleteOffset(currentBaseOffset, rangeIndex, currentHighestCompleted);
+//                });
+//            }
+//        });
+//
+//        serializeAllEncoders();
+//
+//        log.debug("In order: {}", this.sortedEncodingData);
+//
+//        return this;
+//    }
+
+    public void serializeAllEncoders() {
+        sortedEncodingData.clear();
+        List<OffsetEncoderBase> toRemove = new ArrayList<>();
+        for (OffsetEncoderBase encoder : encoders) {
+//            try {
+            encoder.registerSerialisedDataIfEnabled();
+//            } catch (EncodingNotSupportedException e) {
+//                log.debug("Removing {} encoder, not supported ({})", encoder.getEncodingType().description(), e.getMessage());
+//                toRemove.add(encoder);
+//            }
         }
         encoders.removeAll(toRemove);
 
         // compressed versions
         // sizes over LARGE_INPUT_MAP_SIZE_THRESHOLD bytes seem to benefit from compression
-        boolean noEncodingsAreSmallEnough = encoders.stream().noneMatch(OffsetEncoder::quiteSmall);
+        boolean noEncodingsAreSmallEnough = encoders.stream().noneMatch(OffsetEncoderBase::quiteSmall);
         if (noEncodingsAreSmallEnough || compressionForced) {
-            encoders.forEach(OffsetEncoder::registerCompressed);
+            encoders.forEach(OffsetEncoderBase::registerCompressed);
         }
+
+        log.debug("Encoding results: {}", sortedEncodingData);
     }
 
     /**
      * Select the smallest encoding, and pack it.
      *
-     * @see #packEncoding(EncodedOffsetPair)
+     * @see #packEncoding(EncodedOffsetData)
      */
     public byte[] packSmallest() throws EncodingNotSupportedException {
-        if (sortedEncodings.isEmpty()) {
+        if (isNoEncodingNeeded()) {
+            // no compression needed, so return empty / zero
+            return new byte[]{};
+        }
+        // todo might be called multiple times, should cache?
+        // todo need more granular check on this
+        if (sortedEncodingData.isEmpty()) {
             throw new EncodingNotSupportedException("No encodings could be used");
         }
-        final EncodedOffsetPair best = this.sortedEncodings.poll();
+        final EncodedOffsetData best = this.sortedEncodingData.poll();
         log.debug("Compression chosen is: {}", best.encoding.name());
         return packEncoding(best);
     }
@@ -218,7 +285,7 @@ public byte[] packSmallest() throws EncodingNotSupportedException {
     /**
      * Pack the encoded bytes into a magic byte wrapped byte array which indicates the encoding type.
      */
-    byte[] packEncoding(final EncodedOffsetPair best) {
+    byte[] packEncoding(final EncodedOffsetData best) {
         final int magicByteSize = Byte.BYTES;
         final ByteBuffer result = ByteBuffer.allocate(magicByteSize + best.data.capacity());
         result.put(best.encoding.magicByte);
@@ -226,4 +293,162 @@ byte[] packEncoding(final EncodedOffsetPair best) {
         return result.array();
     }
 
+    @Override
+    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+        preCheck(baseOffset, relativeOffset, currentHighestCompleted);
+//        if (preEncodeCheckCanSkip(baseOffset, relativeOffset, currentHighestCompleted))
+//            return;
+
+        for (final OffsetEncoderBase encoder : encoders) {
+            encoder.encodeIncompleteOffset(baseOffset, relativeOffset, currentHighestCompleted);
+        }
+    }
+
+    @Override
+    public void encodeCompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+        preCheck(baseOffset, relativeOffset, currentHighestCompleted);
+//        if (preEncodeCheckCanSkip(baseOffset, relativeOffset, currentHighestCompleted))
+//            return;
+
+        for (final OffsetEncoderBase encoder : encoders) {
+//            try {
+                encoder.encodeCompleteOffset(baseOffset, relativeOffset, currentHighestCompleted);
+//            } catch (EncodingNotSupportedException e) {
+//                encoder.disable(e);
+//            }
+        }
+    }
+
+    private void preCheck(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+        maybeReinitialise(baseOffset, currentHighestCompleted);
+    }
+
+    @Override
+    public void maybeReinitialise(final long currentBaseOffset, final long currentHighestCompleted) {
+        boolean reinitialise = false;
+
+        long newLength = currentHighestCompleted - currentBaseOffset;
+//        if (originalLength != newLength) {
+////        if (this.highestSuceeded != currentHighestCompleted) {
+//            log.debug("Length of Bitset changed {} to {}",
+//                    originalLength, newLength);
+//            reinitialise = true;
+//        }
+
+        if (this.baseOffset < currentBaseOffset) {
+            log.debug("Base offset {} has moved to {} - new continuous blocks of successful work - need to truncate",
+                    this.baseOffset, currentBaseOffset);
+            reinitialise = true;
+        }
+
+        if (currentBaseOffset < this.baseOffset)
+            throw new InternalRuntimeError(msg("New base offset {} smaller than previous {}", currentBaseOffset, baseOffset));
+
+        this.highestSucceeded = currentHighestCompleted; // always track, change has no impact on me
+        this.length = initLength(currentBaseOffset, highestSucceeded);
+
+        if (reinitialise) {
+            initialise(currentBaseOffset, currentHighestCompleted);
+        }
+
+        reinitEncoders(currentBaseOffset, currentHighestCompleted);
+    }
+
+//    private void mabeyAddEncodersIfMissing() {
+//        if (encoders.isEmpty()) {
+//            this.addEncodersMaybe();
+//        }
+//    }
+
+    private boolean preEncodeCheckCanSkip(final long currentBaseOffset, final long relativeOffset, final long currentHighestCompleted) {
+//        checkConditionsHaventChanged(currentBaseOffset, currentHighestCompleted);
+
+        return checkIfEncodingNeededBasedOnLowWater(relativeOffset);
+    }
+
+//    private void checkConditionsHaventChanged(final long currentBaseOffset, final long currentHighestCompleted) {
+//        boolean reinitialise = false;
+//
+//        if (this.highestSuceeded != currentHighestCompleted) {
+//            log.debug("Next expected offset from broker {} has moved to {} - need to reset encoders",
+//                    this.highestSuceeded, currentHighestCompleted);
+//            reinitialise = true;
+//        }
+//
+//        if (this.baseOffset != currentBaseOffset) {
+//            log.debug("Base offset {} has moved to {} - new continuous blocks of successful work - need to reset encoders",
+//                    this.baseOffset, currentBaseOffset);
+//            reinitialise = true;
+//        }
+//
+//        if (reinitialise) {
+//            initialise(currentBaseOffset, currentHighestCompleted);
+//        }
+//    }
+
+    //todo remove don't think this is ever possible, or throw exception
+    private boolean checkIfEncodingNeededBasedOnLowWater(final long relativeOffset) {
+        // only encode if this work is above the low water mark
+        return relativeOffset <= 0;
+    }
+
+    /**
+     * @return the packed size of the best encoder, or 0 if no encodings have been performed / needed
+     */
+    @SneakyThrows
+    @Override
+    public int getEncodedSize() {
+//        if (noEncodingRequiredSoFar) {
+//            return 0;
+//        } else {
+//            OffsetEncoder peek = sortedEncoders.peek();
+//            return peek.getEncodedSize();
+//        }
+        throw new InternalRuntimeError("");
+    }
+
+    @Override
+    public byte[] getEncodedBytes() {
+        return new byte[0];
+    }
+
+    @Override
+    public int getEncodedSizeEstimate() {
+        if (isNoEncodingNeeded() || length < 1) {
+            return 0;
+        } else {
+            if (OffsetMapCodecManager.forcedCodec.isPresent()) {
+                OffsetEncoding offsetEncoding = OffsetMapCodecManager.forcedCodec.get();
+                // todo - this is rubbish
+                OffsetEncoderBase offsetEncoderBase = sortedEncoders.stream().filter(x -> x.getEncodingType().equals(offsetEncoding)).findFirst().get();
+                return offsetEncoderBase.getEncodedSizeEstimate();
+            } else {
+                if (sortedEncoders.isEmpty()) {
+                    throw new InternalRuntimeError("No encoders");
+                }
+                Collections.sort(sortedEncoders);
+                OffsetEncoderBase smallestEncoder = sortedEncoders.get(0);
+                int smallestSizeEstimate = smallestEncoder.getEncodedSizeEstimate();
+                log.debug("Currently estimated smallest codec is {}, needing {} bytes",
+                        smallestEncoder.getEncodingType(), smallestSizeEstimate);
+                return smallestSizeEstimate;
+            }
+        }
+    }
+
+    private boolean isNoEncodingNeeded() {
+        return length < 1;
+    }
+
+    public Object getSmallestCodec() {
+        Collections.sort(sortedEncoders);
+        if (sortedEncoders.isEmpty())
+            throw new InternalRuntimeError("No encoders");
+        return sortedEncoders.get(0);
+    }
+
+    @Override
+    public String toString() {
+        return msg("{} nextExpected: {}, highest succeeded: {}, encoders:{}", getClass().getSimpleName(), baseOffset, highestSucceeded, encoders);
+    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
index 66f6f0917..3ad31a8db 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
@@ -112,6 +112,7 @@ public enum CommitMode {
      * https://github.com/confluentinc/parallel-consumer/issues/21 Dynamic concurrency control with flow control or tcp
      * congestion control theory #21.
      */
+    // TODO maxConcurrency
     @Builder.Default
     private final int maxConcurrency = 16;
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
index 2c2b5a38a..d0f990b5c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessor.java
@@ -8,7 +8,6 @@
 import lombok.*;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.*;
-import org.apache.kafka.clients.consumer.internals.ConsumerCoordinator;
 import org.apache.kafka.clients.producer.*;
 import org.apache.kafka.common.TopicPartition;
 import org.apache.kafka.common.utils.Time;
@@ -16,7 +15,6 @@
 import pl.tlinkowski.unij.api.UniLists;
 
 import java.io.Closeable;
-import java.lang.reflect.Field;
 import java.time.Duration;
 import java.time.Instant;
 import java.util.*;
@@ -44,6 +42,8 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
 
     private final ParallelConsumerOptions options;
 
+//    private final BackoffAnalyser backoffer;
+
     /**
      * Injectable clock for testing
      */
@@ -61,7 +61,7 @@ public class ParallelEoSStreamProcessor<K, V> implements ParallelStreamProcessor
 
     private final Optional<ProducerManager<K, V>> producerManager;
 
-    private final org.apache.kafka.clients.consumer.Consumer<K, V> consumer;
+    private final ConsumerManager<K, V> consumerMgr;
 
     /**
      * The pool which is used for running the users's supplied function
@@ -175,69 +175,72 @@ public ParallelEoSStreamProcessor(ParallelConsumerOptions newOptions) {
 
 //        this.backoffer = new BackoffAnalyser();
 
-        this.consumer = options.getConsumer();
+        consumerMgr = new ConsumerManager<K, V>(options.getConsumer());
+        wm = new WorkManager<K, V>(newOptions, consumerMgr, dynamicExtraLoadFactor);
+
+
+        consumerMgr.checkNotSubscribed();
+        consumerMgr.checkAutoCommitIsDisabled();
 
-        checkNotSubscribed(consumer);
-        checkAutoCommitIsDisabled(consumer);
 
         LinkedBlockingQueue<Runnable> poolQueue = new LinkedBlockingQueue<>();
         workerPool = new ThreadPoolExecutor(newOptions.getMaxConcurrency(), newOptions.getMaxConcurrency(),
                 0L, MILLISECONDS,
-                poolQueue);
-
-        this.wm = new WorkManager<>(newOptions, consumer, dynamicExtraLoadFactor);
+                poolQueue)
+        ;
+//        {
+//            @Override
+//            protected void beforeExecute(final Thread t, final Runnable r) {
+//                super.beforeExecute(t, r);
+//                if (dynamicExtraLoadFactor.couldStep() && getQueue().isEmpty() && wm.isNotPartitionedOrDrained()) {
+//                    boolean increased = dynamicExtraLoadFactor.maybeIncrease();
+//                    if (increased) {
+//                        log.warn("No work to do! Increased dynamic load factor to {}", dynamicExtraLoadFactor.getCurrent());
+//                    }
+//                }
+////                if (getQueue().size() < 100 && wm.isNotPartitionedOrDrained()) {
+////                    log.warn("Less than 100 tasks left!");
+////                }
+//            }
+//        };
 
-        ConsumerManager<K, V> consumerMgr = new ConsumerManager<>(consumer);
 
-        this.brokerPollSubsystem = new BrokerPollSystem<>(consumerMgr, wm, this, newOptions);
+        this.brokerPollSubsystem = new BrokerPollSystem<>(consumerMgr, wm, this);
 
         if (options.isProducerSupplied()) {
             this.producerManager = Optional.of(new ProducerManager<>(options.getProducer(), consumerMgr, this.wm, options));
             if (options.isUsingTransactionalProducer())
-                this.committer = this.producerManager.get();
+                this.committer = producerManager.get();
             else
-                this.committer = this.brokerPollSubsystem;
+                this.committer = new ConsumerOffsetCommitter<>(consumerMgr, wm, options);
         } else {
             this.producerManager = Optional.empty();
-            this.committer = this.brokerPollSubsystem;
-        }
-    }
-
-    private void checkNotSubscribed(org.apache.kafka.clients.consumer.Consumer<K, V> consumerToCheck) {
-        if (consumerToCheck instanceof MockConsumer)
-            // disabled for unit tests which don't test rebalancing
-            return;
-        Set<String> subscription = consumerToCheck.subscription();
-        Set<TopicPartition> assignment = consumerToCheck.assignment();
-        if (!subscription.isEmpty() || !assignment.isEmpty()) {
-            throw new IllegalStateException("Consumer subscription must be managed by this class. Use " + this.getClass().getName() + "#subcribe methods instead.");
+            this.committer = new ConsumerOffsetCommitter<>(consumerMgr, wm, options);
         }
     }
 
     @Override
     public void subscribe(Collection<String> topics) {
-        log.debug("Subscribing to {}", topics);
-        consumer.subscribe(topics, this);
+        consumerMgr.subscribe(topics, this);
     }
 
     @Override
     public void subscribe(Pattern pattern) {
-        log.debug("Subscribing to {}", pattern);
-        consumer.subscribe(pattern, this);
+        consumerMgr.subscribe(pattern, this);
     }
 
     @Override
     public void subscribe(Collection<String> topics, ConsumerRebalanceListener callback) {
         log.debug("Subscribing to {}", topics);
         usersConsumerRebalanceListener = Optional.of(callback);
-        consumer.subscribe(topics, this);
+        subscribe(topics);
     }
 
     @Override
     public void subscribe(Pattern pattern, ConsumerRebalanceListener callback) {
         log.debug("Subscribing to {}", pattern);
         usersConsumerRebalanceListener = Optional.of(callback);
-        consumer.subscribe(pattern, this);
+        subscribe(pattern);
     }
 
     /**
@@ -287,32 +290,6 @@ public void onPartitionsLost(Collection<TopicPartition> partitions) {
         usersConsumerRebalanceListener.ifPresent(x -> x.onPartitionsLost(partitions));
     }
 
-    /**
-     * Nasty reflection to check if auto commit is disabled.
-     * <p>
-     * Other way would be to politely request the user also include their consumer properties when construction, but
-     * this is more reliable in a correctness sense, but britle in terms of coupling to internal implementation.
-     * Consider requesting ability to inspect configuration at runtime.
-     */
-    @SneakyThrows
-    private void checkAutoCommitIsDisabled(org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
-        if (consumer instanceof KafkaConsumer) {
-            // Commons lang FieldUtils#readField - avoid needing commons lang
-            Field coordinatorField = consumer.getClass().getDeclaredField("coordinator"); //NoSuchFieldException
-            coordinatorField.setAccessible(true);
-            ConsumerCoordinator coordinator = (ConsumerCoordinator) coordinatorField.get(consumer); //IllegalAccessException
-
-            Field autoCommitEnabledField = coordinator.getClass().getDeclaredField("autoCommitEnabled");
-            autoCommitEnabledField.setAccessible(true);
-            Boolean isAutoCommitEnabled = (Boolean) autoCommitEnabledField.get(coordinator);
-
-            if (isAutoCommitEnabled)
-                throw new IllegalStateException("Consumer auto commit must be disabled, as commits are handled by the library.");
-        } else {
-            // noop - probably MockConsumer being used in testing - which doesn't do auto commits
-        }
-    }
-
     @Override
     public void poll(Consumer<ConsumerRecord<K, V>> usersVoidConsumptionFunction) {
         Function<ConsumerRecord<K, V>, List<Object>> wrappedUserFunc = (record) -> {
@@ -457,7 +434,7 @@ private void doClose(Duration timeout) throws TimeoutException, ExecutionExcepti
         log.debug("Closing and waiting for broker poll system...");
         brokerPollSubsystem.closeAndWait();
 
-        maybeCloseConsumer();
+        consumerMgr.close(timeout);
 
         producerManager.ifPresent(x -> x.close(timeout));
 
@@ -489,19 +466,19 @@ private void doClose(Duration timeout) throws TimeoutException, ExecutionExcepti
         this.state = closed;
     }
 
-    /**
-     * To keep things simple, make sure the correct thread which can make a commit, is the one to close the consumer.
-     * This way, if partitions are revoked, the commit can be made inline.
-     */
-    private void maybeCloseConsumer() {
-        if (isResponsibleForCommits()) {
-            consumer.close();
-        }
-    }
-
-    private boolean isResponsibleForCommits() {
-        return (committer instanceof ProducerManager);
-    }
+//    /**
+//     * To keep things simple, make sure the correct thread which can make a commit, is the one to close the consumer.
+//     * This way, if partitions are revoked, the commit can be made inline.
+//     */
+//    private void maybeCloseConsumer() {
+//        if (isResponsibleForCommits()) {
+//            consumerMgr.close();
+//        }
+//    }
+//
+//    private boolean isResponsibleForCommits() {
+//        return (committer instanceof ProducerManager);
+//    }
 
     /**
      * Block the calling thread until no more messages are being processed.
@@ -583,8 +560,9 @@ protected <R> void supervisorLoop(Function<ConsumerRecord<K, V>, List<R>> userFu
                 } catch (Exception e) {
                     log.error("Error from poll control thread, will attempt controlled shutdown, then rethrow. Error: " + e.getMessage(), e);
                     doClose(DrainingCloseable.DEFAULT_TIMEOUT); // attempt to close
-                    failureReason = new RuntimeException("Error from poll control thread: " + e.getMessage(), e);
-                    throw failureReason;
+                    RuntimeException runtimeException = new RuntimeException("Error from poll control thread: " + e.getMessage(), e);
+                    this.failureReason = runtimeException;
+                    throw runtimeException;
                 }
             }
             log.info("Control loop ending clean (state:{})...", state);
@@ -617,6 +595,7 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
             }
         }
 
+
         log.trace("Loop: Process mailbox");
         processWorkCompleteMailBox();
 
@@ -644,10 +623,11 @@ private <R> void controlLoop(Function<ConsumerRecord<K, V>, List<R>> userFunctio
         brokerPollSubsystem.supervise();
 
         Duration duration = Duration.ofMillis(1);
+//        log.debug("Thread yield {}", duration);
         try {
             Thread.sleep(duration.toMillis());
         } catch (InterruptedException e) {
-            log.trace("Woke up", e);
+            log.debug("Woke up", e);
         }
 
         // todo remove
@@ -776,7 +756,7 @@ private void transitionToClosing() {
      */
     private void processWorkCompleteMailBox() {
         log.trace("Processing mailbox (might block waiting for results)...");
-        Set<WorkContainer<K, V>> results = new HashSet<>();
+        Set<WorkContainer<K, V>> results = new TreeSet<>(); // insure sorted by offset as we insert
         final Duration timeout = getTimeToNextCommit(); // don't sleep longer than when we're expected to maybe commit
 
 //        boolean nothingInFlight = !wm.hasWorkInFlight();
@@ -813,6 +793,8 @@ private void processWorkCompleteMailBox() {
         } catch (InterruptedException e) {
             log.debug("Interrupted waiting on work results");
         }
+
+        //
         if (firstBlockingPoll == null) {
             log.debug("Mailbox results returned null, indicating timeout (which was set as {}) or interruption during a blocking wait for returned work results", timeout);
         } else {
@@ -825,12 +807,8 @@ private void processWorkCompleteMailBox() {
         log.trace("Draining {} more, got {} already...", size, results.size());
         workMailBox.drainTo(results, size);
 
-        log.trace("Processing drained work {}...", results.size());
-        for (var work : results) {
-            MDC.put("offset", work.toString());
-            handleFutureResult(work);
-            MDC.clear();
-        }
+        log.debug("Processing drained work {}...", results.size());
+        wm.onResultBatch(results);
     }
 
     /**
@@ -915,31 +893,12 @@ private Duration getTimeSinceLastCommit() {
 
     private void commitOffsetsThatAreReady() {
         if (wm.isClean()) {
-            log.debug("Nothing changed since last commit, skipping");
+            log.debug("Nothing succeeded since last commit, skipping");
             return;
         }
         committer.retrieveOffsetsAndCommit();
     }
 
-    protected void handleFutureResult(WorkContainer<K, V> wc) {
-        if (wc.getUserFunctionSucceeded().get()) {
-            onSuccess(wc);
-        } else {
-            onFailure(wc);
-        }
-    }
-
-    private void onFailure(WorkContainer<K, V> wc) {
-        // error occurred, put it back in the queue if it can be retried
-        // if not explicitly retriable, put it back in with an try counter so it can be later given up on
-        wm.failed(wc);
-    }
-
-    protected void onSuccess(WorkContainer<K, V> wc) {
-        log.trace("Processing success...");
-        wm.success(wc);
-    }
-
     /**
      * Submit a piece of work to the processing pool.
      *
@@ -995,8 +954,21 @@ protected <R> List<Tuple<ConsumerRecord<K, V>, R>> userFunctionRunner(Function<C
             addToMailbox(wc); // always add on error
             throw e; // trow again to make the future failed
         }
+//        finally {
+//            onWorkFunctionFinish();
+//        }
     }
 
+//    private void onWorkFunctionFinish() {
+//        checkEnoughWorkIsQueued()
+//    }
+//
+//    private void checkEnoughWorkIsQueued() {
+//        if (isPoolQueueLow()) {
+//            notifyNewWorkRegistered();
+//        }
+//    }
+
     protected void addToMailBoxOnUserFunctionSuccess(WorkContainer<K, V> wc, List<?> resultsFromUserFunction) {
         addToMailbox(wc);
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RunLengthEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RunLengthEncoder.java
index 438b95016..088a39eb8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RunLengthEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/RunLengthEncoder.java
@@ -1,33 +1,63 @@
 package io.confluent.parallelconsumer;
 
+import io.confluent.csid.utils.Range;
+import lombok.*;
+import lombok.extern.slf4j.Slf4j;
+
 import java.nio.ByteBuffer;
-import java.util.ArrayList;
-import java.util.List;
-import java.util.Optional;
-import java.util.concurrent.atomic.AtomicBoolean;
-import java.util.concurrent.atomic.AtomicInteger;
+import java.util.*;
 
+import static io.confluent.csid.utils.JavaUtils.safeCast;
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.OffsetEncoding.*;
 
-class RunLengthEncoder extends OffsetEncoder {
+/**
+ * Always starts with failed or incomplete offsets. todo docs tail runlength?
+ */
+@ToString(onlyExplicitlyIncluded = true, callSuper = true)
+@Slf4j
+class RunLengthEncoder extends OffsetEncoderBase {
+
+    /**
+     * The current run length being counted / built
+     */
+    private int currentRunLengthCount;
+
+    private int previousRelativeOffsetFromBase;
 
-    private int currentRunLengthCount = 0;
-    private boolean previousRunLengthState = false;
+    private boolean previousRunLengthState;
 
-    private final List<Integer> runLengthEncodingIntegers;
+    /**
+     * Stores all the run lengths
+     */
+    @Getter
+    private List<Integer> runLengthEncodingIntegers;
 
     private Optional<byte[]> encodedBytes = Optional.empty();
 
+    @ToString.Include
     private final Version version; // default to new version
 
     private static final Version DEFAULT_VERSION = Version.v2;
 
-    public RunLengthEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) {
-        super(offsetSimultaneousEncoder);
-        // run length setup
-        runLengthEncodingIntegers = new ArrayList<>();
+    public RunLengthEncoder(long baseOffset, OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) {
+        super(baseOffset, offsetSimultaneousEncoder);
         version = newVersion;
+
+        init();
+    }
+
+    private void init() {
+        runLengthEncodingIntegers = new ArrayList<>();
+        runLengthOffsetPairs = new TreeSet<>();
+        currentRunLengthCount = 0;
+        previousRelativeOffsetFromBase = 0;
+        previousRunLengthState = false;
+    }
+
+    private void reset() {
+        log.debug("Resetting");
+        init();
     }
 
     @Override
@@ -47,35 +77,36 @@ protected OffsetEncoding getEncodingTypeCompressed() {
     }
 
     @Override
-    public void encodeIncompleteOffset(final int rangeIndex) {
-        encodeRunLength(false);
+    public void encodeIncompleteOffset(final long newBaseOffset, final int relativeOffset) {
+        encodeRunLength(false, newBaseOffset, relativeOffset);
     }
 
     @Override
-    public void encodeCompletedOffset(final int rangeIndex) {
-        encodeRunLength(true);
+    public void encodeCompletedOffset(final long newBaseOffset, final int relativeOffset) {
+        encodeRunLength(true, newBaseOffset, relativeOffset);
     }
 
     @Override
     public byte[] serialise() throws EncodingNotSupportedException {
-        runLengthEncodingIntegers.add(currentRunLengthCount); // add tail
+//        addTail();
+
+        int entryWidth = getEntryWidth();
+
+        ByteBuffer runLengthEncodedByteBuffer = ByteBuffer.allocate(getSize() * entryWidth);
 
-        int entryWidth = switch (version) {
-            case v1 -> Short.BYTES;
-            case v2 -> Integer.BYTES;
-        };
-        ByteBuffer runLengthEncodedByteBuffer = ByteBuffer.allocate(runLengthEncodingIntegers.size() * entryWidth);
 
-        for (final Integer runlength : runLengthEncodingIntegers) {
+        //for (final Integer run : getRunLengthEncodingIntegers()) {
+        for (final RunLengthEntry n : runLengthOffsetPairs) {
+            Integer run = n.runLength;
             switch (version) {
                 case v1 -> {
-                    final short shortCastRunlength = runlength.shortValue();
-                    if (runlength != shortCastRunlength)
-                        throw new RunlengthV1EncodingNotSupported(msg("Runlength too long for Short ({} cast to {})", runlength, shortCastRunlength));
+                    final short shortCastRunlength = run.shortValue();
+                    if (run != shortCastRunlength)
+                        throw new RunlengthV1EncodingNotSupported(msg("Runlength too long for Short ({} cast to {})", run, shortCastRunlength));
                     runLengthEncodedByteBuffer.putShort(shortCastRunlength);
                 }
                 case v2 -> {
-                    runLengthEncodedByteBuffer.putInt(runlength);
+                    runLengthEncodedByteBuffer.putInt(run);
                 }
             }
         }
@@ -85,25 +116,542 @@ public byte[] serialise() throws EncodingNotSupportedException {
         return array;
     }
 
+    private int getSize() {
+        //return runLengthEncodingIntegers.size();
+        return runLengthOffsetPairs.size();
+    }
+
+    /**
+     * Add the dangling in flight run to the list, done before serialising
+     */
+//    void addTail() {
+//        if (runLengthOffsetPairs.isEmpty()) {
+//            addRunLength(originalBaseOffset, currentRunLengthCount, safeCast(originalBaseOffset));
+//        } else {
+//            RunLengthEntry previous = runLengthOffsetPairs.last();
+//            int relativeOffsetFromBase = safeCast(previous.startOffset + previous.runLength - originalBaseOffset);
+//            addRunLength(originalBaseOffset, currentRunLengthCount, relativeOffsetFromBase);
+//        }
+//    }
+    private int getEntryWidth() {
+        return switch (version) {
+            case v1 -> Short.BYTES;
+            case v2 -> Integer.BYTES;
+        };
+    }
+//
+//    @Override
+//    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset) {
+//asdf
+//    }
+//
+//    @Override
+//    public void encodeCompletedOffset(final long baseOffset, final long relativeOffset) {
+//asdf
+//    }
+
+    @Override
+    public void encodeIncompleteOffset(final long baseOffset, final long relativeOffset, final long currentHighestCompleted) {
+        // noop
+    }
+
+
+    @Override
+    public void encodeCompleteOffset(final long newBaseOffset, final long relativeOffset, final long currentHighestCompleted) {
+        maybeReinitialise(newBaseOffset, currentHighestCompleted);
+
+        encodeCompletedOffset(newBaseOffset, safeCast(relativeOffset));
+    }
+
+    @Override
+    public void maybeReinitialise(final long newBaseOffset, final long currentHighestCompleted) {
+        boolean reinitialise = false;
+
+        long newLength = currentHighestCompleted - newBaseOffset;
+//        if (originalLength != newLength) {
+////        if (this.highestSuceeded != currentHighestCompleted) {
+//            log.debug("Length of Bitset changed {} to {}",
+//                    originalLength, newLength);
+//            reinitialise = true;
+//        }
+
+        if (originalBaseOffset != newBaseOffset) {
+            log.debug("Base offset {} has moved to {} - new continuous blocks of successful work",
+                    this.originalBaseOffset, newBaseOffset);
+            reinitialise = true;
+        }
+
+        if (newBaseOffset < originalBaseOffset)
+            throw new InternalRuntimeError("");
+
+        if (reinitialise) {
+            reinitialise(newBaseOffset, currentHighestCompleted);
+        }
+    }
+
+    private void reinitialise(final long newBaseOffset, final long currentHighestCompleted) {
+//        long longDelta = newBaseOffset - originalBaseOffset;
+//        int baseDelta = JavaUtils.safeCast(longDelta);
+        truncateRunlengthsV2(newBaseOffset);
+
+
+//        currentRunLengthCount = 0;
+//        previousRelativeOffsetFromBase = 0;
+//        previousRunLengthState = false;
+
+        enable();
+    }
+
+    NavigableSet<RunLengthEntry> runLengthOffsetPairs = new TreeSet<>();
+//
+
+    @ToString
+    @EqualsAndHashCode(onlyExplicitlyIncluded = true)
+    static class RunLengthEntry implements Comparable<RunLengthEntry> {
+
+        @Getter
+        @EqualsAndHashCode.Include
+        private long startOffset;
+
+        @Getter
+        private Integer runLength;
+
+//        @Getter
+//        private boolean succeeded;
+
+        public RunLengthEntry(final long startOffset) {
+            this(startOffset, null);
+        }
+
+        public RunLengthEntry(final long startOffset, final Integer runLength) {
+            if (startOffset < 0) {
+                throw new IllegalArgumentException(msg("Bad start offset {}", startOffset, runLength));
+            }
+            this.startOffset = startOffset;
+//            this.succeeded = succeeded;
+            if (runLength != null)
+                setRunLength(runLength);
+        }
+
+        public void setRunLength(final int runLength) {
+            if (runLength < 1) {
+                throw new IllegalArgumentException(msg("Bad run length {}", runLength));
+            }
+            this.runLength = runLength;
+        }
+
+        /**
+         * Inclusive end offset of the range this entry represents
+         */
+        public long getEndOffsetInclusive() {
+            return startOffset + runLength - 1;
+        }
+
+        public long getEndOffsetExclusive() {
+            return startOffset + runLength;
+        }
+
+        public int getRelativeStartOffsetFromBase(final long baseOffset) {
+            return Math.toIntExact(startOffset - baseOffset);
+        }
+
+        public int getRelativeEndOffsetFromBase(final long baseOffset) {
+            return Math.toIntExact(getRelativeStartOffsetFromBase(baseOffset) + runLength - 1);
+        }
+
+        @Override
+        public int compareTo(final RunLengthEncoder.RunLengthEntry o) {
+            return Long.compare(startOffset, o.startOffset);
+        }
+
+    }
+
+    /**
+     * For each run entry, see if it's below the base, if it is, drop it. Find the first run length that intersects with
+     * the new base, and truncate it. Finish.
+     * <p>
+     * Uses cached positions so it does't have to search
+     */
+    void truncateRunlengthsV2(final long newBaseOffset) {
+        // else nothing to truncate
+        if (!runLengthOffsetPairs.isEmpty()) {
+
+            if (runLengthOffsetPairs.size() > 2_000) {
+                log.debug("length: {}", runLengthEncodingIntegers.size());
+            }
+//
+//        {
+//            // sanity
+//            RunLengthEntry first = runLengthOffsetPairs.first();
+//            RunLengthEntry second = runLengthOffsetPairs.higher(first);
+//            if (first.getEndOffsetInclusive() + 1 != second.startOffset)
+//                throw new RuntimeException("");
+//        }
+
+            RunLengthEntry intersectionRunLength = runLengthOffsetPairs.floor(new RunLengthEntry(newBaseOffset));
+            if (intersectionRunLength == null)
+                throw new InternalRuntimeError("Couldn't find interception point");
+            else if (newBaseOffset > intersectionRunLength.getEndOffsetInclusive()) {
+                // there is no intersection as the new base offset is a point beyond what our run lengths encode
+                // remove all
+                runLengthOffsetPairs.clear();
+            } else {
+                // truncate intersection run length
+                long adjustedRunLength = intersectionRunLength.runLength - (newBaseOffset - intersectionRunLength.startOffset);
+                intersectionRunLength.setRunLength(safeCast(adjustedRunLength));
+
+                // truncate all runlengths before intersection point
+                NavigableSet<RunLengthEntry> toTruncateFromSet = runLengthOffsetPairs.headSet(intersectionRunLength, false);
+                toTruncateFromSet.clear();
+            }
+//
+//        {
+//            // sanity
+//            RunLengthEntry first = runLengthOffsetPairs.first();
+//            RunLengthEntry second = runLengthOffsetPairs.higher(first);
+//            if (first.getEndOffsetInclusive() + 1 != second.startOffset)
+//                throw new RuntimeException("");
+//        }
+        }
+
+        //
+        this.originalBaseOffset = newBaseOffset;
+    }
+
+    /**
+     * For each run entry, see if it's below the base, if it is, drop it. Find the first run length that intersects with
+     * the new base, and truncate it. Finish.
+     */
+    void truncateRunlengths(final int newBaseOffset) {
+        int currentOffset = 0;
+        if (runLengthEncodingIntegers.size() > 1000) {
+            log.info("length: {}", runLengthEncodingIntegers.size());
+        }
+        int index = 0;
+        int adjustedRunLength = -1;
+        for (Integer aRunLength : runLengthEncodingIntegers) {
+            currentOffset = currentOffset + aRunLength;
+            if (currentOffset <= newBaseOffset) {
+                // drop from new collection
+            } else {
+                // found first intersection - truncate
+                adjustedRunLength = currentOffset - newBaseOffset;
+                break; // done
+            }
+            index++;
+        }
+        if (adjustedRunLength == -1) throw new InternalRuntimeError("Couldn't find interception point");
+        List<Integer> integers = runLengthEncodingIntegers.subList(index, runLengthEncodingIntegers.size());
+        integers.set(0, adjustedRunLength); // overwrite with adjusted
+
+        // swap
+        this.runLengthEncodingIntegers = integers;
+
+        //
+        this.originalBaseOffset = newBaseOffset;
+    }
+
     @Override
     public int getEncodedSize() {
         return encodedBytes.get().length;
     }
 
     @Override
-    protected byte[] getEncodedBytes() {
+    public int getEncodedSizeEstimate() {
+        int numEntries = getSize();
+//        if (currentRunLengthCount > 0)
+//            numEntries = numEntries + 1;
+        int entryWidth = getEntryWidth();
+        int accumulativeEntrySize = numEntries * entryWidth;
+        return accumulativeEntrySize;// + standardOverhead;
+    }
+
+    @Override
+    public byte[] getEncodedBytes() {
         return encodedBytes.get();
     }
 
-    private void encodeRunLength(final boolean currentIsComplete) {
+    private void encodeRunLength(final boolean currentIsComplete, final long newBaseOffset, final int relativeOffsetFromBase) {
+        segmentOrCombinePreviousEntryIfNeeded(currentIsComplete, newBaseOffset, relativeOffsetFromBase);
+    }
+
+    private void encodeRunLengthOld(final boolean currentIsComplete, final long newBaseOffset, final int relativeOffsetFromBase) {
+        boolean segmented = injectGapsWithIncomplete(currentIsComplete, newBaseOffset, relativeOffsetFromBase);
+        if (segmented)
+            return;
+
         // run length
         boolean currentOffsetMatchesOurRunLengthState = previousRunLengthState == currentIsComplete;
+
+        //
+
         if (currentOffsetMatchesOurRunLengthState) {
-            currentRunLengthCount++;
+//            currentRunLengthCount++; // no gap case
+            int dynamicPrevious = getPreviousRelativeOffset(safeCast(newBaseOffset) + relativeOffsetFromBase);
+            int dynamicPrevious2 = getPreviousRelativeOffset2(newBaseOffset, relativeOffsetFromBase) - 1;
+            int delta = relativeOffsetFromBase - previousRelativeOffsetFromBase;
+            int delta2 = relativeOffsetFromBase - dynamicPrevious2;
+            int currentRunLengthCountOld = currentRunLengthCount + delta;
+            int currentRunLengthCountNew = currentRunLengthCount + delta2;
+            currentRunLengthCount = currentRunLengthCountNew;
         } else {
             previousRunLengthState = currentIsComplete;
-            runLengthEncodingIntegers.add(currentRunLengthCount);
+            addRunLength(newBaseOffset, currentRunLengthCount, relativeOffsetFromBase);
+            currentRunLengthCount = 1; // reset to 1
+        }
+        previousRelativeOffsetFromBase = relativeOffsetFromBase;
+    }
+
+    /**
+     * @return the added entry
+     */
+    private RunLengthEntry addRunLength(final long newBaseOffset, final int runLength, final int relativeOffsetFromBase) {
+        // v1
+//        runLengthEncodingIntegers.add(runLength);
+
+        // v2
+        int offset = safeCast(newBaseOffset + relativeOffsetFromBase);
+//        if (!runLengthOffsetPairs.isEmpty()) {
+//            RunLengthEntry previous = runLengthOffsetPairs.last();
+//            if (previous != null && offset != previous.getEndOffsetInclusive() + 1)
+//                throw new IllegalArgumentException(msg("Can't add a run length offset {} that's not continuous from previous {}", offset, previous));
+//        }
+        RunLengthEntry entry = new RunLengthEntry(offset, runLength);
+        boolean containedAlready = !runLengthOffsetPairs.add(entry);
+        if (containedAlready)
+            throw new InternalRuntimeError(msg("Already contained a run for offset {}", offset));
+        return entry;
+    }
+
+    private boolean injectGapsWithIncomplete(final boolean currentIsComplete, final long newBaseOffset, final int relativeOffsetFromBase) {
+        boolean segmented = segmentOrCombinePreviousEntryIfNeeded(currentIsComplete, newBaseOffset, relativeOffsetFromBase);
+        if (segmented)
+            return true;
+
+//        boolean bothThisRecordAndPreviousRecordAreComplete = previousRunLengthState && currentIsComplete;
+//        if (bothThisRecordAndPreviousRecordAreComplete) {
+        int differenceold = relativeOffsetFromBase - previousRelativeOffsetFromBase - 1;
+        int previousOffsetOld = previousRelativeOffsetFromBase - 1;
+
+        int previousRelativeOffset = getPreviousRelativeOffset(safeCast(newBaseOffset) + relativeOffsetFromBase);
+        int previousRelativeOffset2 = getPreviousRelativeOffset2(newBaseOffset, relativeOffsetFromBase);
+
+        RunLengthEntry dynamicPrevious = runLengthOffsetPairs.floor(new RunLengthEntry(safeCast(newBaseOffset + relativeOffsetFromBase)));
+        int previousOffset = (dynamicPrevious == null) ? 0 : dynamicPrevious.runLength - safeCast(newBaseOffset + currentRunLengthCount);
+
+        // difference Between This Relative Offset And Previous Run Length Entry In Run Length Sequence
+        int difference = relativeOffsetFromBase - previousOffset;
+
+        if (currentRunLengthCount == 0)
+            differenceold++;
+
+        //
+        if (difference > 0) {
+            // check for gap - if there's a gap, we need to assume all in-between are incomplete, except the first
+            // If they don't exist, this action has no affect, as we only use it to skip succeeded
+
+            // if we already have an ongoing run length, add it first
+            if (currentRunLengthCount != 0) {
+                addRunLength(newBaseOffset, currentRunLengthCount, previousOffset - currentRunLengthCount + 1);
+            }
+
+            //
+            // there is a gap, so first insert the incomplete
+            addRunLength(newBaseOffset, difference, relativeOffsetFromBase - difference);
             currentRunLengthCount = 1; // reset to 1
+            previousRunLengthState = true; // make it no flip
+            previousRelativeOffsetFromBase = relativeOffsetFromBase;
+        }
+//        }
+        return segmented;
+    }
+
+    private boolean segmentOrCombinePreviousEntryIfNeeded(final boolean currentIsComplete, final long newBaseOffset, final int relativeOffsetFromBase) {
+        if (!currentIsComplete) {
+            throw new InternalRuntimeError("Entries being added should always be complete, as the range by definition starts out incomplete. We never add incompletes because things never transition from complete to incomplete.");
+        }
+        RunLengthEntry intersectingWith = runLengthOffsetPairs.floor(new RunLengthEntry(newBaseOffset + relativeOffsetFromBase));
+        if (intersectingWith == null) {
+            // first entry
+            addRunLength(newBaseOffset, relativeOffsetFromBase, 0); // derived incompletes
+            addRunLength(newBaseOffset, 1, relativeOffsetFromBase); // this complete
+            return false;
         }
+
+        long offset = newBaseOffset + relativeOffsetFromBase;
+        boolean segmented = false;
+        boolean willInteractWithAnExistingRun = offset >= intersectingWith.startOffset && offset < intersectingWith.getEndOffsetExclusive();
+        if (willInteractWithAnExistingRun) {
+            // segment
+
+            RunLengthEntry next = runLengthOffsetPairs.higher(intersectingWith);
+
+            segmented = true;
+
+            if (intersectingWith.runLength == 1) {
+                // simple path
+                // single bad entry to be replaced, but with 2 good entry neighbors - combine all three
+                RunLengthEntry previous = runLengthOffsetPairs.lower(intersectingWith);
+                int newRun = 0;
+                if (previous != null) {
+                    int runDown = previous.runLength;
+                    newRun = newRun + runDown;
+                }
+                int runUp = next.runLength;
+                newRun = newRun + 1 + runUp;
+                runLengthOffsetPairs.remove(previous);
+                runLengthOffsetPairs.remove(intersectingWith);
+                runLengthOffsetPairs.remove(next);
+                runLengthOffsetPairs.add(new RunLengthEntry(intersectingWith.startOffset, newRun));
+            } else {
+
+                // remove the old entry which must have been incompletes
+                boolean missing = !runLengthOffsetPairs.remove(intersectingWith);
+                if (missing)
+                    throw new InternalRuntimeError("Cant find element that previously existed");
+
+                int newRunCumulative = 1;
+                Integer offsetStartRelative = null;
+
+                // create the three to replace the intersected node - 1 incomplete, 1 complete (this one), 1 incomplete
+                int firstRun = safeCast(offset - intersectingWith.startOffset);
+                Integer middleRelativeOffset = null;
+                int firstRelativeOffset = intersectingWith.getRelativeStartOffsetFromBase(originalBaseOffset);
+
+                if (firstRun > 0) {
+                    // large gap to fill
+//                RunLengthEntry runLengthEntry = new RunLengthEntry(intersectingWith.startOffset, firstRun);
+                    RunLengthEntry first = addRunLength(newBaseOffset, firstRun, firstRelativeOffset);
+                    middleRelativeOffset = first.getRelativeStartOffsetFromBase(originalBaseOffset) + first.runLength;
+                } else {
+                    // combine with the neighbor as there's no gap
+                    // check for a lower neighbour
+                    RunLengthEntry previous = runLengthOffsetPairs.lower(intersectingWith);
+                    if (previous != null && previous.getEndOffsetExclusive() == offset) {
+                        // lower neighbor connects - combine
+                        newRunCumulative = newRunCumulative + previous.runLength;
+                        offsetStartRelative = previous.getRelativeStartOffsetFromBase(newBaseOffset);
+                        runLengthOffsetPairs.remove(previous);
+                    }
+                }
+
+                if (middleRelativeOffset == null)
+                    middleRelativeOffset = firstRelativeOffset;
+
+                if (next != null) {
+                    int gapUpward = next.getRelativeStartOffsetFromBase(newBaseOffset) - middleRelativeOffset;
+                    if (gapUpward > 1) {
+                        // there is a large gap between this success and the next
+                        // add this single entry now then, and then add gap filler
+//                    if (offsetStartRelative == null)
+//                        offsetStartRelative = next.getRelativeStartOffsetFromBase(newBaseOffset) - 1; // shift left one place
+//                    newRunCumulative = newRunCumulative + 1;
+
+                        if (offsetStartRelative == null)
+                            offsetStartRelative = relativeOffsetFromBase;
+
+                        RunLengthEntry middle = addRunLength(newBaseOffset, newRunCumulative, offsetStartRelative);
+
+                        // add incomplete filler
+                        int lastRange = safeCast(intersectingWith.getEndOffsetInclusive() - offset);
+                        if (lastRange > 0) {
+                            addRunLength(newBaseOffset, lastRange, middleRelativeOffset + 1);
+//                        int fillerStart = middle.getRelativeEndOffsetFromBase(newBaseOffset);
+//                        int use = (fillerStart != middleRelativeOffset + 1)?
+//                        if (fillerStart != middleRelativeOffset + 1) {
+//                            log.trace("");
+//                        }
+//                        addRunLength(newBaseOffset, lastRange, fillerStart);
+                        }
+                    } else if (gapUpward == 1) {
+                        // combine with upper
+                        newRunCumulative = newRunCumulative + next.runLength; // expand
+//                next.setRunLength(newRunLength);
+                        runLengthOffsetPairs.remove(next);
+                        if (offsetStartRelative == null)
+                            offsetStartRelative = next.getRelativeStartOffsetFromBase(newBaseOffset) - 1; // shift left one place if not already established
+                        RunLengthEntry end = addRunLength(newBaseOffset, newRunCumulative, offsetStartRelative);
+                    } else {
+                        throw new InternalRuntimeError("Invalid gap {}", gapUpward);
+                    }
+                }
+            }
+            // have to check upward too
+//            checkGapDownward(newBaseOffset, relativeOffsetFromBase);
+        } else {
+            // new entry higher than any existing
+            checkGapDownward(newBaseOffset, relativeOffsetFromBase);
+        }
+        return segmented;
+    }
+
+    private void checkGapDownward(final long newBaseOffset, final int relativeOffsetFromBase) {
+        // extending the range
+        // is there a gap?
+        RunLengthEntry previous = runLengthOffsetPairs.floor(new RunLengthEntry(newBaseOffset + relativeOffsetFromBase));
+        int previousRelativeEnd = previous.getRelativeEndOffsetFromBase(originalBaseOffset);
+        int gap = relativeOffsetFromBase - previousRelativeEnd;
+        if (gap > 1) {
+            // extend and fill gap
+            // add incompletes
+            int newRelativeOffset = previousRelativeEnd + 1;
+            int run = gap - 1;
+//            int gapEntryPosition = previous.getRelativeStartOffsetFromBase(newBaseOffset);
+            RunLengthEntry addedGapFiller = addRunLength(newBaseOffset, run, newRelativeOffset);
+            // add this
+            RunLengthEntry thisEntry = addRunLength(newBaseOffset, 1, relativeOffsetFromBase); // this complete
+        } else if (gap == 1) {
+            // there's no gap between this and last completed, so combine
+            RunLengthEntry toCombineWithCurrent = runLengthOffsetPairs.last();
+            int newExtendedRunLength = toCombineWithCurrent.getRunLength() + 1;
+            toCombineWithCurrent.setRunLength(newExtendedRunLength);
+        } else if (gap == 0) {
+            throw new InternalRuntimeError("Invalid gap {}", gap);
+        } else {
+            throw new InternalRuntimeError("Invalid gap {}", gap);
+        }
+    }
+
+    private int getPreviousRelativeOffset(final int offset) {
+        RunLengthEntry dynamicPrevious = runLengthOffsetPairs.floor(new RunLengthEntry(offset));
+        int previousOffset = (dynamicPrevious == null) ? 0 : dynamicPrevious.runLength - safeCast(originalBaseOffset);
+        return previousOffset;
     }
+
+    private int getPreviousRelativeOffset2(final long newBaseOffset, final int offset) {
+        RunLengthEntry dynamicPrevious = runLengthOffsetPairs.floor(new RunLengthEntry(offset));
+        int previousOffset = (dynamicPrevious == null) ? 0 : dynamicPrevious.runLength - safeCast(originalBaseOffset);
+        return previousOffset - safeCast(newBaseOffset + currentRunLengthCount);
+    }
+
+    /**
+     * @return the offsets which are succeeded
+     */
+    public List<Long> calculateSucceededActualOffsets() {
+        List<Long> successfulOffsets = new ArrayList<>();
+        boolean succeeded = false;
+//        int previous = 0;
+        long offsetPosition = originalBaseOffset;
+        //for (final Integer run : runLengthEncodingIntegers) {
+        for (final RunLengthEntry n : runLengthOffsetPairs) {
+            int run = n.getRunLength();
+            if (succeeded) {
+//                offsetPosition++;
+                for (final Integer integer : Range.range(run)) {
+                    long newGoodOffset = offsetPosition + integer;
+                    successfulOffsets.add(newGoodOffset);
+                }
+            }
+//            else {
+//                offsetPosition = offsetPosition + run;
+//            }
+
+            //
+            offsetPosition += run;
+//            previous = run;
+            succeeded = !succeeded;
+        }
+        return successfulOffsets;
+    }
+
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
new file mode 100644
index 000000000..2a45b5cba
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WindowedEventRate.java
@@ -0,0 +1,30 @@
+package io.confluent.parallelconsumer;
+
+public class WindowedEventRate {
+
+    private double normalizedRate; // event rate / window
+    private long windowSizeTicks;
+    private long lastEventTicks;
+
+
+    public WindowedEventRate(int aWindowSizeSeconds) {
+        windowSizeTicks = aWindowSizeSeconds * 1000L;
+        lastEventTicks = System.currentTimeMillis();
+    }
+
+    public double newEvent() {
+//        long currentTicks = System.currentTimeMillis();
+        long currentTicks = System.nanoTime();
+        long period = currentTicks - lastEventTicks;
+        lastEventTicks = currentTicks;
+        double normalizedFrequency = (double) windowSizeTicks / (double) period;
+
+        double alpha = Math.min(1.0 / normalizedFrequency, 1.0);
+        normalizedRate = (alpha * normalizedFrequency) + ((1.0 - alpha) * normalizedRate);
+        return getRate();
+    }
+
+    public double getRate() {
+        return normalizedRate * 1_000_000L / windowSizeTicks;
+    }
+}
\ No newline at end of file
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
index 7498ae55f..5275abba5 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkContainer.java
@@ -4,6 +4,7 @@
  * Copyright (C) 2020 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.StringUtils;
 import io.confluent.csid.utils.WallClock;
 import lombok.*;
 import lombok.extern.slf4j.Slf4j;
@@ -25,7 +26,14 @@
 @EqualsAndHashCode
 public class WorkContainer<K, V> implements Comparable<WorkContainer> {
 
-    private final String DEFAULT_TYPE = "DEFAULT";
+    private static final String DEFAULT_TYPE = "DEFAULT";
+
+    /**
+     * Assignment generation this record comes from. Used for fencing messages after partition loss, for work lingering
+     * in the system of in flight.
+     */
+    @Getter
+    private final int epoch;
 
     /**
      * Simple way to differentiate treatment based on type
@@ -36,11 +44,15 @@ public class WorkContainer<K, V> implements Comparable<WorkContainer> {
 
     @Getter
     private final ConsumerRecord<K, V> cr;
-    private int numberOfAttempts;
+
+    @Getter
+    private int numberOfFailedAttempts;
+
     private Optional<Instant> failedAt = Optional.empty();
+
     private boolean inFlight = false;
 
-    @Getter
+    //    @Getter
     private Optional<Boolean> userFunctionSucceeded = Optional.empty();
 
     /**
@@ -54,12 +66,12 @@ public class WorkContainer<K, V> implements Comparable<WorkContainer> {
     private Future<List<Object>> future;
     private long timeTakenAsWorkMs;
 
-    public WorkContainer(ConsumerRecord<K, V> cr) {
-        this.cr = cr;
-        workType = DEFAULT_TYPE;
+    public WorkContainer(int epoch, ConsumerRecord<K, V> cr) {
+        this(epoch, cr, DEFAULT_TYPE);
     }
 
-    public WorkContainer(ConsumerRecord<K, V> cr, String workType) {
+    public WorkContainer(int epoch, ConsumerRecord<K, V> cr, String workType) {
+        this.epoch = epoch;
         this.cr = cr;
         Objects.requireNonNull(workType);
         this.workType = workType;
@@ -67,7 +79,7 @@ public WorkContainer(ConsumerRecord<K, V> cr, String workType) {
 
     public void fail(WallClock clock) {
         log.trace("Failing {}", this);
-        numberOfAttempts++;
+        numberOfFailedAttempts++;
         failedAt = Optional.of(clock.getNow());
         inFlight = false;
     }
@@ -97,12 +109,14 @@ private Temporal tryAgainAt(WallClock clock) {
             return clock.getNow();
     }
 
+    /**
+     * @return compares by offset
+     */
     @Override
-    public int compareTo(WorkContainer o) {
+    public int compareTo(WorkContainer workToCompare) {
         long myOffset = this.cr.offset();
-        long theirOffset = o.cr.offset();
-        int compare = Long.compare(myOffset, theirOffset);
-        return compare;
+        long theirOffset = workToCompare.cr.offset();
+        return Long.compare(myOffset, theirOffset);
     }
 
     public boolean isNotInFlight() {
@@ -132,18 +146,21 @@ public void onUserFunctionFailure() {
     }
 
     public boolean isUserFunctionComplete() {
-        return this.getUserFunctionSucceeded().isPresent();
+        return userFunctionSucceeded.isPresent();
     }
 
     public boolean isUserFunctionSucceeded() {
-        Optional<Boolean> userFunctionSucceeded = this.getUserFunctionSucceeded();
+        Optional<Boolean> userFunctionSucceeded = this.userFunctionSucceeded;
         return userFunctionSucceeded.orElse(false);
     }
 
     @Override
     public String toString() {
-//        return "WorkContainer(" + toTP(cr) + ":" + cr.offset() + ":" + cr.key() + ":" + cr.value() + ")";
-        return "WorkContainer(" + toTP(cr) + ":" + cr.offset() + ":" + cr.key() + ")";
+        return StringUtils.msg("WorkContainer({}:{}:{}:{})", getTopicPartition(), cr.offset(), cr.key(), isUserFunctionSucceeded());
+    }
+
+    public boolean hasPreviouslyFailed() {
+        return numberOfFailedAttempts > 0;
     }
 
     public Duration getTimeInFlight() {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index 5e3cbe015..ef6911928 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -5,6 +5,7 @@
  */
 
 import io.confluent.csid.utils.LoopingResumingIterator;
+import io.confluent.csid.utils.Range;
 import io.confluent.csid.utils.WallClock;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import lombok.Getter;
@@ -15,8 +16,10 @@
 import org.apache.kafka.clients.consumer.ConsumerRecords;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
+import org.slf4j.MDC;
 import org.slf4j.event.Level;
 import pl.tlinkowski.unij.api.UniLists;
+import pl.tlinkowski.unij.api.UniMaps;
 import pl.tlinkowski.unij.api.UniSets;
 
 import java.time.Duration;
@@ -29,13 +32,22 @@
 import static io.confluent.csid.utils.BackportUtils.toSeconds;
 import static io.confluent.csid.utils.KafkaUtils.toTP;
 import static io.confluent.csid.utils.LogUtils.at;
+import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
+import static java.lang.Math.abs;
 import static java.lang.Math.min;
 import static lombok.AccessLevel.PACKAGE;
 
 /**
  * Sharded, prioritised, offset managed, order controlled, delayed work queue.
+ * <p>
+ * Low Water Mark - the highest offset (continuously successful) with all it's previous messages succeeded (the offset
+ * one commits to broker)
+ * <p>
+ * High Water Mark - the highest offset which has succeeded (previous may be incomplete)
+ * <p>
+ * Highest seen offset - the highest ever seen offset
  *
  * @param <K>
  * @param <V>
@@ -71,6 +83,14 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      * @see #findCompletedEligibleOffsetsAndRemove
      */
     private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new ConcurrentHashMap<>();
+    //    private final Map<TopicPartition, NavigableMap<Long, WorkContainer<K, V>>> partitionCommitQueues = new HashMap<>();
+
+    /**
+     * Continuous offset encodings
+     */
+    private final Map<TopicPartition, OffsetSimultaneousEncoder> partitionContinuousOffsetEncoders = new ConcurrentHashMap<>();
+
+//    private final BackoffAnalyser backoffer;
 
     private final DynamicLoadFactor dynamicLoadFactor;
 
@@ -85,6 +105,19 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     @Getter
     private int numberRecordsOutForProcessing = 0;
 
+
+    /**
+     * todo docs The multiple that should be pre-loaded awaiting processing. Consumer already pipelines, so we shouldn't
+     * need to pipeline ourselves too much.
+     * todo docs
+     * The multiple that should be pre-loaded awaiting processing. Consumer already pipelines, so we shouldn't need to
+     * pipeline ourselves too much.
+     * <p>
+     * Note how this relates to {@link BrokerPollSystem#getLongPollTimeout()} - if longPollTimeout is high and loading
+     * factor is low, there may not be enough messages queued up to satisfy demand.
+     */
+    private final int loadingFactor = 3;
+
     /**
      * Useful for testing
      */
@@ -94,22 +127,59 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     @Setter(PACKAGE)
     private WallClock clock = new WallClock();
 
-    org.apache.kafka.clients.consumer.Consumer<K, V> consumer;
+    ConsumerManager consumerMgr;
 
     // visible for testing
     /**
-     * Offsets, which have been seen, beyond the highest committable offset, which haven't been totally completed
+     * A subset of Offsets, beyond the highest committable offset, which haven't been totally completed.
+     * <p>
+     * We only need to know the full incompletes when we do the {@link #findCompletedEligibleOffsetsAndRemove} scan, so
+     * find the full sent only then, and discard. Otherwise, for continuous encoding, the encoders track it them
+     * selves.
+     * <p>
+     * We work with incompletes, instead of completes, because it's a bet that most of the time the storage space for
+     * storing the incompletes in memory will be smaller.
+     *
+     * @see #findCompletedEligibleOffsetsAndRemove(boolean)
+     * @see #encodeWorkResult(boolean, WorkContainer)
+     * @see #onSuccess(WorkContainer)
+     * @see #onFailure(WorkContainer)
      */
-    Map<TopicPartition, Set<Long>> partitionIncompleteOffsets = new HashMap<>();
+    Map<TopicPartition, Set<Long>> partitionOffsetsIncompleteMetadataPayloads = new ConcurrentHashMap<>();
 
     // visible for testing
     /**
      * The highest seen offset for a partition
      */
-    Map<TopicPartition, Long> partitionOffsetHighWaterMarks = new HashMap<>();
+    Map<TopicPartition, Long> partitionOffsetHighestSeen = new HashMap<>();
+
+    /**
+     * Highest offset which has completed
+     */
+    Map<TopicPartition, Long> partitionOffsetHighestSucceeded = new ConcurrentHashMap<>();
+
+    /**
+     * If true, more messages are allowed to process for this partition.
+     * <p>
+     * If false, we have calculated that we can't record any more offsets for this partition, as our best performing
+     * encoder requires nearly as much space is available for this partitions allocation of the maximum offset metadata
+     * size.
+     * <p>
+     * Default (missing elements) is true - more messages can be processed.
+     *
+     * @see #manageOffsetEncoderSpaceRequirements()
+     * @see OffsetMapCodecManager#DefaultMaxMetadataSize
+     */
+    Map<TopicPartition, Boolean> partitionMoreRecordsAllowedToProcess = new ConcurrentHashMap<>();
+
+    /**
+     * Highest committable offset - the end offset of the highest (from the lowest seen) continuous set of completed
+     * offsets. AKA low water mark.
+     */
+    Map<TopicPartition, Long> partitionOffsetHighestContinuousSucceeded = new ConcurrentHashMap<>();
 
     // visible for testing
-    long MISSING_HIGH_WATER_MARK = -1L;
+    long MISSING_HIGHEST_SEEN = -1L;
 
     /**
      * Get's set to true whenever work is returned completed, so that we know when a commit needs to be made.
@@ -119,27 +189,44 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
      */
     private AtomicBoolean workStateIsDirtyNeedsCommitting = new AtomicBoolean(false);
 
+    private int numberOfAssignedPartitions;
+
     // TODO remove
-    public WorkManager(ParallelConsumerOptions options, org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
+    public WorkManager(ParallelConsumerOptions options, ConsumerManager consumer) {
         this(options, consumer, new DynamicLoadFactor());
     }
 
-    public WorkManager(final ParallelConsumerOptions newOptions, final org.apache.kafka.clients.consumer.Consumer<K, V> consumer, final DynamicLoadFactor dynamicExtraLoadFactor) {
+    public WorkManager(final ParallelConsumerOptions newOptions, final ConsumerManager consumer, final DynamicLoadFactor dynamicExtraLoadFactor) {
         this.options = newOptions;
-        this.consumer = consumer;
+        this.consumerMgr = consumer;
         this.dynamicLoadFactor = dynamicExtraLoadFactor;
         this.wmbm = new WorkMailBoxManager<K, V>();
+
+        //        backoffer = new BackoffAnalyser(options.getMaxConcurrency() * 10);
     }
 
+    Map<TopicPartition, Integer> partitionsAssignmentEpochs = new HashMap<>();
+
     /**
      * Load offset map for assigned partitions
      */
     @Override
     public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
+        incrementPartitionAssignmentEpoch(partitions);
+
+        // init messages allowed state
+        for (final TopicPartition partition : partitions) {
+            partitionMoreRecordsAllowedToProcess.putIfAbsent(partition, true);
+        }
+
+        numberOfAssignedPartitions = numberOfAssignedPartitions + partitions.size();
+        log.info("Assigned {} partitions - that's {} bytes per partition for encoding offset overruns",
+                numberOfAssignedPartitions, OffsetMapCodecManager.DefaultMaxMetadataSize / numberOfAssignedPartitions);
+
         try {
             log.debug("onPartitionsAssigned: {}", partitions);
             Set<TopicPartition> partitionsSet = UniSets.copyOf(partitions);
-            OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(this, this.consumer);
+            OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<K, V>(this, this.consumerMgr);
             om.loadOffsetMapForPartition(partitionsSet);
         } catch (Exception e) {
             log.error("Error in onPartitionsAssigned", e);
@@ -147,6 +234,16 @@ public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
         }
     }
 
+    private void incrementPartitionAssignmentEpoch(final Collection<TopicPartition> partitions) {
+        for (final TopicPartition partition : partitions) {
+            int epoch = partitionsAssignmentEpochs.getOrDefault(partition, -1);
+            epoch++;
+            partitionsAssignmentEpochs.put(partition, epoch);
+        }
+    }
+
+    private List<TopicPartition> partitionsToRemove = new ArrayList<>();
+
     /**
      * Clear offset map for revoked partitions
      * <p>
@@ -156,9 +253,14 @@ public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
      */
     @Override
     public void onPartitionsRevoked(Collection<TopicPartition> partitions) {
+        incrementPartitionAssignmentEpoch(partitions);
+
+        numberOfAssignedPartitions = numberOfAssignedPartitions - partitions.size();
+
         try {
             log.debug("Partitions revoked: {}", partitions);
-            resetOffsetMapAndRemoveWork(partitions);
+//            removePartitionFromRecordsAndShardWork(partitions);
+            registerPartitionsToBeRemoved(partitions);
         } catch (Exception e) {
             log.error("Error in onPartitionsRevoked", e);
             throw e;
@@ -170,25 +272,46 @@ public void onPartitionsRevoked(Collection<TopicPartition> partitions) {
      */
     @Override
     public void onPartitionsLost(Collection<TopicPartition> partitions) {
+        incrementPartitionAssignmentEpoch(partitions);
+
+        numberOfAssignedPartitions = numberOfAssignedPartitions - partitions.size();
+
         try {
-            log.warn("Partitions have been lost");
-            log.debug("Lost partitions: {}", partitions);
-            resetOffsetMapAndRemoveWork(partitions);
+            log.warn("Partitions have been lost: {}", partitions);
+//            log.debug("Lost partitions: {}", partitions);
+//            removePartitionFromRecordsAndShardWork(partitions);
+            registerPartitionsToBeRemoved(partitions);
         } catch (Exception e) {
             log.error("Error in onPartitionsLost", e);
             throw e;
         }
     }
 
-    private void resetOffsetMapAndRemoveWork(Collection<TopicPartition> partitions) {
-        for (TopicPartition partition : partitions) {
-            partitionIncompleteOffsets.remove(partition);
-            partitionOffsetHighWaterMarks.remove(partition);
-            NavigableMap<Long, WorkContainer<K, V>> oldWorkPartitionQueue = partitionCommitQueues.remove(partition);
-            if (oldWorkPartitionQueue != null) {
-                removeShardsFoundIn(oldWorkPartitionQueue);
+    /**
+     * Called by other threads (broker poller) to be later removed inline by control.
+     */
+    private void registerPartitionsToBeRemoved(Collection<TopicPartition> partitions) {
+        partitionsToRemove.addAll(partitions);
+    }
+
+    private void removePartitionFromRecordsAndShardWork() {
+        for (TopicPartition partition : partitionsToRemove) {
+            log.debug("Removing records for partition {}", partition);
+            // todo is there a safer way than removing these?
+            partitionOffsetHighestSeen.remove(partition);
+            partitionOffsetHighestSucceeded.remove(partition);
+            partitionOffsetHighestContinuousSucceeded.remove(partition);
+            partitionOffsetsIncompleteMetadataPayloads.remove(partition);
+//            partitionMoreRecordsAllowedToProcess.remove(partition);
+
+            //
+            NavigableMap<Long, WorkContainer<K, V>> oldWorkPartitionCommitQueue = partitionCommitQueues.remove(partition);
+
+            //
+            if (oldWorkPartitionCommitQueue != null) {
+                removeShardsFoundIn(oldWorkPartitionCommitQueue);
             } else {
-                log.trace("Removing empty commit queue");
+                log.trace("Removed empty commit queue");
             }
         }
     }
@@ -199,6 +322,7 @@ private void resetOffsetMapAndRemoveWork(Collection<TopicPartition> partitions)
      * @param oldWorkPartitionQueue partition set to scan for unique keys to be removed from our shard queue
      */
     private void removeShardsFoundIn(NavigableMap<Long, WorkContainer<K, V>> oldWorkPartitionQueue) {
+        log.trace("Searching for and removing work found in shard queue");
         // this all scanning loop could be avoided if we also store a map of unique keys found referenced when a
         // partition is assigned, but that could worst case grow forever
         for (WorkContainer<K, V> work : oldWorkPartitionQueue.values()) {
@@ -213,6 +337,9 @@ public void registerWork(List<ConsumerRecords<K, V>> records) {
         }
     }
 
+    /**
+     * @see WorkMailBoxManager#registerWork(ConsumerRecords)
+     */
     public void registerWork(ConsumerRecords<K, V> records) {
         wmbm.registerWork(records);
     }
@@ -220,15 +347,23 @@ public void registerWork(ConsumerRecords<K, V> records) {
     private void processInbox(final int requestedMaxWorkToRetrieve) {
         wmbm.processInbox(requestedMaxWorkToRetrieve);
 
+        if (requestedMaxWorkToRetrieve < 1) {
+            // none requested
+            return;
+        }
+
+        //
+//        int inFlight = getNumberOfEntriesInPartitionQueues();
+//        int max = getMaxToGoBeyondOffset();
+//        int gap = max - inFlight;
         int gap = requestedMaxWorkToRetrieve;
         int taken = 0;
 
+//        log.debug("Will register {} (max configured: {}) records of work ({} already registered)", gap, max, inFlight);
         Queue<ConsumerRecord<K, V>> internalFlattenedMailQueue = wmbm.getInternalFlattenedMailQueue();
+        log.debug("Will attempt to register and get {} requested records, {} available", requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
 
-        log.debug("Will attempt to register the requested {} - {} available in internal mailbox",
-                requestedMaxWorkToRetrieve, internalFlattenedMailQueue.size());
-
-        //
+        // process individual records
         while (taken < gap && !internalFlattenedMailQueue.isEmpty()) {
             ConsumerRecord<K, V> poll = internalFlattenedMailQueue.poll();
             boolean takenAsWork = processInbox(poll);
@@ -239,23 +374,127 @@ private void processInbox(final int requestedMaxWorkToRetrieve) {
 
         log.debug("{} new records were registered.", taken);
 
+//        ArrayList<ConsumerRecords<K, V>> toRemove = new ArrayList<>();
+//        for (final ConsumerRecords<K, V> records : internalBatchMailQueue) {
+//            records.
+//
+//        }
+//        boolean moreRecordsCanBeAccepted = processInbox(records);
+//        if (moreRecordsCanBeAccepted)
+//            toRemove.add(records);
+//        internalBatchMailQueue.removeAll(toRemove);
+    }
+
+//    private int getMaxToGoBeyondOffset() {
+//        return backoffer.getCurrentTotalMaxCountBeyondOffset();
+//    }
+
+//    /**
+//     * @return true if the records were accepted, false if they cannot be
+//     * @see #processInbox()
+//     */
+//    private boolean processInbox(ConsumerRecords<K, V> records) {
+//        int partitionWorkRemainingCount = getWorkQueuedInShardsCount();
+//        int recordsToAdd = records.count();
+//        // we don't break up individual record sets (although we could, but "overhead") so need to queue up records even if it goes over by some amount
+//        boolean overMax = partitionWorkRemainingCount - recordsToAdd >= getMaxToGoBeyondOffset();
+//        if (overMax) {
+//            log.debug("Work remaining in partition queues has surpassed max, so won't bring further messages in from the pipeline queued: {} / max: {}",
+//                    partitionWorkRemainingCount, getMaxToGoBeyondOffset());
+//            return false;
+//        }
+//
+////        if (!inboundOffsetWidthWithinRange(records)) {
+////            return false;
+////        }
+//
+//        //
+//        log.debug("Registering {} records of work ({} already registered)", recordsToAdd, partitionWorkRemainingCount);
+//
+//        for (ConsumerRecord<K, V> rec : records) {
+//            processInbox(rec);
+//        }
+//
+//        return true;
+//    }
+
+    private boolean inboundOffsetWidthWithinRange(final ConsumerRecords<K, V> records) {
+        // brute force - surely very slow. surely this info can be cached?
+        Map<TopicPartition, List<ConsumerRecord<K, V>>> inbound = new HashMap<>();
+        for (final ConsumerRecord<K, V> record : records) {
+            TopicPartition tp = new TopicPartition(record.topic(), record.partition());
+            inbound.computeIfAbsent(tp, (ignore) -> new ArrayList<>()).add(record);
+        }
+
+        Set<Map.Entry<TopicPartition, List<ConsumerRecord<K, V>>>> inboundPartitionQueues = inbound.entrySet();
+        for (final Map.Entry<TopicPartition, List<ConsumerRecord<K, V>>> inboundPartitionQueue : inboundPartitionQueues) {
+            // get highest start offset
+            long start = 0l;
+            TopicPartition tp = inboundPartitionQueue.getKey();
+            NavigableMap<Long, WorkContainer<K, V>> longWorkContainerNavigableMap = partitionCommitQueues.get(tp);
+            if (longWorkContainerNavigableMap != null) {
+                for (final Map.Entry<Long, WorkContainer<K, V>> longWorkContainerEntry : longWorkContainerNavigableMap.entrySet()) {
+                    WorkContainer<K, V> value = longWorkContainerEntry.getValue();
+                    boolean userFunctionSucceeded = value.isUserFunctionSucceeded();
+                    if (!userFunctionSucceeded) {
+                        start = value.getCr().offset();
+
+                        // now find any record what would make the width too big. Binary search?
+                        // brute force
+                        List<ConsumerRecord<K, V>> inboundRecordQueue = inboundPartitionQueue.getValue();
+//                        ConsumerRecord<K, V> highestOffsetInboundRecord = inboundRecordQueue.get(inboundRecordQueue.size() - 1);
+//                        long newEnd = highestOffsetInboundRecord.offset();
+
+                        for (final ConsumerRecord<K, V> inboundRecord : inboundRecordQueue) {
+                            long newEnd = inboundRecord.offset();
+                            long width = newEnd - start;
+
+                            if (width >= BitsetEncoder.MAX_LENGTH_ENCODABLE) {
+                                long oldWidth = partitionOffsetHighestSeen.get(tp) - start;
+                                // can't be more accurate unless we break up the inbound records and count them per queue
+                                log.debug("Incoming outstanding offset difference too large for BitSet encoder (incoming width: {}, old width: {}), will wait before adding these records until the width shrinks (below {})",
+                                        width, oldWidth, BitsetEncoder.MAX_LENGTH_ENCODABLE);
+                                return false;
+//                                break;
+                            } else {
+                                log.debug("Width was ok {}", width);
+                            }
+                        }
+                    }
+                }
+            }
+        }
+        return true;
     }
 
     /**
      * @return true if the record was taken, false if it was skipped (previously successful)
      */
     private boolean processInbox(final ConsumerRecord<K, V> rec) {
-        if (isRecordPreviouslyProcessed(rec)) {
+        if (isRecordPreviouslyProcessedSuccessfully(rec)) {
             log.trace("Record previously processed, skipping. offset: {}", rec.offset());
             return false;
         } else {
             Object shardKey = computeShardKey(rec);
             long offset = rec.offset();
-            var wc = new WorkContainer<>(rec);
-
             TopicPartition tp = toTP(rec);
-            raisePartitionHighWaterMark(offset, tp);
 
+            Integer currentPartitionEpoch = partitionsAssignmentEpochs.get(tp);
+            if (currentPartitionEpoch == null) {
+                throw new InternalRuntimeError(msg("Received message for a partition which is not assigned: {}", rec));
+            }
+            var wc = new WorkContainer<>(currentPartitionEpoch, rec);
+
+            raisePartitionHighestSeen(offset, tp);
+
+            //
+            checkPreviousLowWaterMarks(wc);
+            checkHighestSucceededSoFar(wc);
+
+            //
+            prepareContinuousEncoder(wc);
+
+            //
             processingShards.computeIfAbsent(shardKey, (ignore) -> new ConcurrentSkipListMap<>()).put(offset, wc);
 
             partitionCommitQueues.computeIfAbsent(tp, (ignore) -> new ConcurrentSkipListMap<>()).put(offset, wc);
@@ -264,28 +503,50 @@ private boolean processInbox(final ConsumerRecord<K, V> rec) {
         }
     }
 
-    void raisePartitionHighWaterMark(long highWater, TopicPartition tp) {
+    private void prepareContinuousEncoder(final WorkContainer<K, V> wc) {
+        TopicPartition tp = wc.getTopicPartition();
+        if (!partitionContinuousOffsetEncoders.containsKey(tp)) {
+            OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(partitionOffsetHighestContinuousSucceeded.get(tp), partitionOffsetHighestSucceeded.get(tp));
+            partitionContinuousOffsetEncoders.put(tp, encoder);
+        }
+    }
+
+    private void checkHighestSucceededSoFar(final WorkContainer<K, V> wc) {
+        // preivous record must be completed if we've never seen this before
+        partitionOffsetHighestSucceeded.putIfAbsent(wc.getTopicPartition(), wc.offset() - 1);
+    }
+
+    /**
+     * If we've never seen a record for this partition before, it must be our first ever seen record for this partition,
+     * which means by definition, it's previous offset is the low water mark.
+     */
+    private void checkPreviousLowWaterMarks(final WorkContainer<K, V> wc) {
+        long previousLowWaterMark = wc.offset() - 1;
+        partitionOffsetHighestContinuousSucceeded.putIfAbsent(wc.getTopicPartition(), previousLowWaterMark);
+    }
+
+    void raisePartitionHighestSeen(long seenOffset, TopicPartition tp) {
         // rise the high water mark
-        Long oldHighWaterMark = partitionOffsetHighWaterMarks.getOrDefault(tp, MISSING_HIGH_WATER_MARK);
-        if (highWater >= oldHighWaterMark || highWater == MISSING_HIGH_WATER_MARK) {
-            partitionOffsetHighWaterMarks.put(tp, highWater);
+        Long oldHighestSeen = partitionOffsetHighestSeen.getOrDefault(tp, MISSING_HIGHEST_SEEN);
+        if (seenOffset > oldHighestSeen || seenOffset == MISSING_HIGHEST_SEEN) {
+            partitionOffsetHighestSeen.put(tp, seenOffset);
         }
     }
 
-    private boolean isRecordPreviouslyProcessed(ConsumerRecord<K, V> rec) {
-        long offset = rec.offset();
+    private boolean isRecordPreviouslyProcessedSuccessfully(ConsumerRecord<K, V> rec) {
+        long thisRecordsOffset = rec.offset();
         TopicPartition tp = new TopicPartition(rec.topic(), rec.partition());
-        Set<Long> incompleteOffsets = this.partitionIncompleteOffsets.getOrDefault(tp, new TreeSet<>());
-        if (incompleteOffsets.contains(offset)) {
+        Set<Long> incompleteOffsets = this.partitionOffsetsIncompleteMetadataPayloads.getOrDefault(tp, new TreeSet<>());
+        if (incompleteOffsets.contains(thisRecordsOffset)) {
             // record previously saved as having not been processed
             return false;
         } else {
-            Long offsetHighWaterMarks = partitionOffsetHighWaterMarks.getOrDefault(tp, MISSING_HIGH_WATER_MARK);
-            if (offset < offsetHighWaterMarks) {
-                // within the range of tracked offsets, so must have been previously completed
+            Long partitionHighestSeenRecord = partitionOffsetHighestSeen.getOrDefault(tp, MISSING_HIGHEST_SEEN);
+            if (thisRecordsOffset <= partitionHighestSeenRecord) {
+                // within the range of tracked offsets, but not in incompletes, so must have been previously completed
                 return true;
             } else {
-                // we haven't recorded this far up, so must not have been processed yet
+                // not in incompletes, and is a higher offset than we've ever seen, as we haven't recorded this far up, so must not have been processed yet
                 return false;
             }
         }
@@ -298,6 +559,9 @@ private Object computeShardKey(ConsumerRecord<K, V> rec) {
         };
     }
 
+    /**
+     * @return the maximum amount of work possible
+     */
     public <R> List<WorkContainer<K, V>> maybeGetWork() {
         return maybeGetWork(Integer.MAX_VALUE);
     }
@@ -306,6 +570,11 @@ public <R> List<WorkContainer<K, V>> maybeGetWork() {
      * Depth first work retrieval.
      */
     public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
+        //int minWorkToGetSetting = min(min(requestedMaxWorkToRetrieve, getMaxMessagesToQueue()), getMaxToGoBeyondOffset());
+//        int minWorkToGetSetting = min(requestedMaxWorkToRetrieve, getMaxToGoBeyondOffset());
+//        int workToGetDelta = requestedMaxWorkToRetrieve - getRecordsOutForProcessing();
+        removePartitionFromRecordsAndShardWork();
+
         int workToGetDelta = requestedMaxWorkToRetrieve;
 
         // optimise early
@@ -314,10 +583,10 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
         }
 
         // todo this counts all partitions as a whole - this may cause some partitions to starve. need to round robin it?
-        int available = getWorkQueuedInShardsCount();
-        int extraNeededFromInboxToSatisfy = requestedMaxWorkToRetrieve - available;
-        log.debug("Requested: {}, available in shards: {}, will try retrieve from mailbox the delta of: {}",
-                requestedMaxWorkToRetrieve, available, extraNeededFromInboxToSatisfy);
+        int workAvailable = getWorkQueuedInShardsCount();
+        int extraNeededFromInboxToSatisfy = requestedMaxWorkToRetrieve - workAvailable;
+        log.debug("Requested: {}, workAvailable in shards: {}, will try retrieve from mailbox the delta of: {}",
+                requestedMaxWorkToRetrieve, workAvailable, extraNeededFromInboxToSatisfy);
         processInbox(extraNeededFromInboxToSatisfy);
 
         //
@@ -331,7 +600,7 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
             log.trace("Looking for work on shard: {}", shard.getKey());
             if (work.size() >= workToGetDelta) {
                 this.iterationResumePoint = Optional.of(shard.getKey());
-                log.debug("Work taken is now over max, stopping (saving iteration resume point {})", iterationResumePoint);
+                log.debug("Work taken is now over max requested, stopping (saving iteration resume point {})", iterationResumePoint);
                 break;
             }
 
@@ -343,24 +612,46 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
             for (var queueEntry : shardQueueEntries) {
                 int taken = work.size() + shardWork.size();
                 if (taken >= workToGetDelta) {
-                    log.trace("Work taken ({}) exceeds max ({})", taken, workToGetDelta);
+                    log.trace("Work taken ({}) exceeds max requested ({})", taken, workToGetDelta);
                     break;
                 }
 
-                var wc = queueEntry.getValue();
-                boolean alreadySucceeded = !wc.isUserFunctionSucceeded();
-                if (wc.hasDelayPassed(clock) && wc.isNotInFlight() && alreadySucceeded) {
-                    log.trace("Taking {} as work", wc);
-                    wc.takingAsWork();
-                    shardWork.add(wc);
+                var workContainer = queueEntry.getValue();
+                var topicPartitionKey = workContainer.getTopicPartition();
+
+                {
+                    if (checkEpoch(workContainer)) continue;
+                }
+
+                // TODO refactor this and the rest of the partition state monitoring code out
+                // check we have capacity in offset storage to process more messages
+                Boolean allowedMoreRecords = partitionMoreRecordsAllowedToProcess.get(topicPartitionKey);
+                // If the record has been previosly attempted, it is already represented in the current offset encoding,
+                // and may in fact be the message holding up the partition so must be retried
+                if (!allowedMoreRecords && workContainer.hasPreviouslyFailed()) {
+                    OffsetSimultaneousEncoder offsetSimultaneousEncoder = partitionContinuousOffsetEncoders.get(topicPartitionKey);
+                    int encodedSizeEstimate = offsetSimultaneousEncoder.getEncodedSizeEstimate();
+                    int metaDataAvailable = getMetadataSpaceAvailablePerPartition();
+                    log.warn("Not allowed more records for the partition ({}) that this record ({}) belongs to due to offset " +
+                                    "encoding back pressure, continuing on to next container in shard (estimated " +
+                                    "required: {}, max available (without tolerance threshold): {})",
+                            topicPartitionKey, workContainer.offset(), encodedSizeEstimate, metaDataAvailable);
+                    continue;
+                }
+
+                boolean alreadySucceeded = !workContainer.isUserFunctionSucceeded();
+                if (workContainer.hasDelayPassed(clock) && workContainer.isNotInFlight() && alreadySucceeded) {
+                    log.trace("Taking {} as work", workContainer);
+                    workContainer.takingAsWork();
+                    shardWork.add(workContainer);
                 } else {
-                    Duration timeInFlight = wc.getTimeInFlight();
+                    Duration timeInFlight = workContainer.getTimeInFlight();
                     Level level = Level.TRACE;
                     if (toSeconds(timeInFlight) > 1) {
                         level = Level.WARN;
                     }
                     at(log, level).log("Work ({}) still delayed ({}) or is in flight ({}, time in flight: {}), alreadySucceeded? {} can't take...",
-                            wc, !wc.hasDelayPassed(clock), !wc.isNotInFlight(), timeInFlight, alreadySucceeded);
+                            workContainer, !workContainer.hasDelayPassed(clock), !workContainer.isNotInFlight(), timeInFlight, alreadySucceeded);
                 }
 
                 ProcessingOrder ordering = options.getOrdering();
@@ -400,29 +691,378 @@ private void checkShardsForProgress() {
 
     }
 
-    public void success(WorkContainer<K, V> wc) {
+    /**
+     * Have our partitions been revoked?
+     */
+    private boolean checkEpoch(final WorkContainer<K, V> workContainer) {
+        TopicPartition topicPartitionKey = workContainer.getTopicPartition();
+
+        Integer currentPartitionEpoch = partitionsAssignmentEpochs.get(topicPartitionKey);
+        int workEpoch = workContainer.getEpoch();
+        if (currentPartitionEpoch != workEpoch) {
+            log.warn("Epoch mismatch {} vs {} - were partitions lost? Skipping message - it's already assigned to a different consumer.", workEpoch, currentPartitionEpoch);
+            return true;
+        }
+        return false;
+    }
+
+//
+//    private int getMaxMessagesToQueue() {
+//        //return options.getNumberOfThreads() * options.getLoadingFactor();
+//        double rate = successRatePer5Seconds.getRate();
+//        int newRatae = (int) rate * 2;
+//        int max = Math.max(newRatae, options.getMaxConcurrency() * 10);
+//        log.debug("max to queue: {}", max);
+//        return max;
+////        return options.getNumberOfThreads() * 10;
+//    }
+
+//    private final WindowedEventRate successRatePer5Seconds = new WindowedEventRate(5);
+//    private final ExponentialMovingAverage successRatePer5SecondsEMA = new ExponentialMovingAverage(0.5);
+
+    public void onSuccess(WorkContainer<K, V> wc) {
+        //
+//        successRatePer5Seconds.newEvent();
+//        successRatePer5SecondsEMA.
+
+        //
         workStateIsDirtyNeedsCommitting.set(true);
+
+        //
+        // update as we go
+        updateHighestSucceededOffsetSoFar(wc);
+
+        //
         ConsumerRecord<K, V> cr = wc.getCr();
         log.trace("Work success ({}), removing from processing shard queue", wc);
         wc.succeed();
+
+        //
         Object key = computeShardKey(cr);
+
         // remove from processing queues
         NavigableMap<Long, WorkContainer<K, V>> shard = processingShards.get(key);
         long offset = cr.offset();
         shard.remove(offset);
+
         // If using KEY ordering, where the shard key is a message key, garbage collect old shard keys (i.e. KEY ordering we may never see a message for this key again)
         boolean keyOrdering = options.getOrdering().equals(KEY);
         if (keyOrdering && shard.isEmpty()) {
             log.trace("Removing empty shard (key: {})", key);
             processingShards.remove(key);
         }
+
+        //
         successfulWorkListeners.forEach((c) -> c.accept(wc)); // notify listeners
         numberRecordsOutForProcessing--;
+
+        encodeWorkResult(true, wc);
+
+        // remove work from partition commit queue
+        log.trace("Removing {} from partition queue", wc.offset());
+        partitionCommitQueues.get(wc.getTopicPartition()).remove(wc.offset());
     }
 
-    public void failed(WorkContainer<K, V> wc) {
+    public void onResultBatch(final Set<WorkContainer<K, V>> results) {
+        //
+        if (!results.isEmpty()) {
+            onResultUpdatePartitionRecordsBatch(results);
+        }
+
+        //
+        manageOffsetEncoderSpaceRequirements();
+
+
+//        // individual
+//        for (var work : results) {
+//            handleFutureResult(work);
+//        }
+    }
+
+    protected void handleFutureResult(WorkContainer<K, V> wc) {
+        MDC.put("offset", wc.toString());
+        TopicPartition tp = wc.getTopicPartition();
+        if (wc.getEpoch() < partitionsAssignmentEpochs.get(tp)) {
+            log.warn("message assigned from old epoch, ignore: {}", wc);
+            return;
+        }
+        if (wc.isUserFunctionSucceeded()) {
+            onSuccess(wc);
+        } else {
+            onFailure(wc);
+        }
+        MDC.clear();
+    }
+
+    /**
+     * Rin algorithms that benefit from seeing chunks of work results
+     */
+    private void onResultUpdatePartitionRecordsBatch(final Set<WorkContainer<K, V>> results) {
+        //
+        onResultUpdateHighestContinuousBatch(results);
+    }
+
+    private void onResultUpdatePartitionRecords(WorkContainer<K, V> work) {
+        TopicPartition tp = work.getTopicPartition();
+
+        if (work.isUserFunctionSucceeded()) {
+
+        } else {
+            // no op?
+
+            // this is only recorded in the encoders
+            // partitionOffsetsIncompleteMetadataPayloads;
+        }
+    }
+
+    /**
+     * AKA highest committable or low water mark
+     *
+     * @param workResults must be sorted by offset - partition ordering doesn't matter, as long as we see offsets in
+     *                    order
+     */
+    private void onResultUpdateHighestContinuousBatch(final Set<? extends WorkContainer<K, V>> workResults) {
+        HashSet<TopicPartition> partitionsSeenForLogging = new HashSet<>();
+        Map<TopicPartition, Long> originalMarks = new HashMap<>();
+        Map<TopicPartition, Boolean> partitionNowFormsAContinuousBlock = new HashMap<>();
+        for (final WorkContainer<K, V> work : workResults) {
+            if (checkEpoch(work)) continue;
+
+            TopicPartition tp = work.getTopicPartition();
+
+            // guard against old epoch messages
+            // TODO don't do this as upon revoke we try to commit this work. Maybe the commit attempt needs to mark the epoch as discarded, and in that case we should do this drop
+//            if (work.getEpoch() < parittionsAssignmentEpochs.get(tp)) {
+//                log.warn("Message assigned from old epoch, ignore: {}", work);
+//                continue;
+//            }
+
+
+            long thisOffset = work.getCr().offset();
+
+
+            // this offset has already been scanned as a part of a high range batch, so skip (we already know the highest continuous block incorporates this offset)
+            Long previousHighestContinuous = partitionOffsetHighestContinuousSucceeded.get(tp);
+            if (thisOffset <= previousHighestContinuous) {
+//                     sanity? by definition it must be higher
+//                    throw new InternalRuntimeError(msg("Unexpected new offset {} lower than low water mark {}", thisOffset, previousHighestContinuous));
+                // things can be racey, so this can happen, if so, just continue
+                log.debug("Completed offset {} lower than current highest continuous offset {} - must have been completed while previous continuous blocks were being examined", thisOffset, previousHighestContinuous);
+//                continue; - can't skip #handleResult
+            } else {
+
+
+                // We already know this partition's continuous range has been broken, no point checking
+                Boolean partitionSoFarIsContinuous = partitionNowFormsAContinuousBlock.get(tp);
+                if (partitionSoFarIsContinuous != null && !partitionSoFarIsContinuous) {
+                    // previously we found non continuous block so we can skip
+//                    continue; // to next record - can't skip #handleResult
+                } else {
+                    // we can't know, we have to keep digging
+
+
+                    boolean thisOffsetIsFailed = !work.isUserFunctionSucceeded();
+                    partitionsSeenForLogging.add(tp);
+
+                    if (thisOffsetIsFailed) {
+                        // simpler path
+                        // work isn't successful. Is this the first? Is there a gap previously? Perhaps the gap doesn't exist (skipped offsets in partition)
+                        Boolean previouslyContinuous = partitionNowFormsAContinuousBlock.get(tp);
+                        partitionNowFormsAContinuousBlock.put(tp, false); // this partitions continuous block
+                    } else {
+
+                        // does it form a new continuous block?
+
+                        // queue this offset belongs to
+                        NavigableMap<Long, WorkContainer<K, V>> commitQueue = partitionCommitQueues.get(tp);
+
+                        boolean continuous = true;
+                        if (thisOffset != previousHighestContinuous + 1) {
+                            // do the entries in the gap exist in our partition queue? or are they skipped in the source log?
+                            long rangeBase = (previousHighestContinuous < 0) ? 0 : previousHighestContinuous + 1;
+                            Range offSetRangeToCheck = new Range(rangeBase, thisOffset);
+                            log.trace("Gap detected between {} and {}", rangeBase, thisOffset);
+                            for (var offsetToCheck : offSetRangeToCheck) {
+                                WorkContainer<K, V> workToExamine = commitQueue.get((long) offsetToCheck);
+                                if (workToExamine != null) {
+                                    if (!workToExamine.isUserFunctionSucceeded()) {
+                                        log.trace("Record exists {} but is incomplete - breaks continuity finish early", workToExamine);
+                                        partitionNowFormsAContinuousBlock.put(tp, false);
+                                        continuous = false;
+                                        break;
+                                    } else if (workToExamine.isUserFunctionSucceeded() && !workToExamine.isNotInFlight()) {
+                                        log.trace("Work {} comparing to succeeded work still in flight: {} (but not part of this batch)", work.offset(), workToExamine);
+//                                        continue;  - can't skip #handleResult
+                                    } else {
+                                        // counts as continuous, just isn't in this batch - previously successful but there used to be gaps
+                                        log.trace("Work not in batch, but seen now in commitQueue as succeeded {}", workToExamine);
+                                    }
+                                } else {
+                                    // offset doesn't exist in commit queue, can assume doesn't exist in source, or is completed
+                                    log.trace("Work offset {} checking against offset {} missing from commit queue, assuming doesn't exist in source", work.offset(), offsetToCheck);
+                                }
+                            }
+
+                        }
+                        if (continuous) {
+                            partitionNowFormsAContinuousBlock.put(tp, true);
+                            if (!originalMarks.containsKey(tp)) {
+                                Long previousOffset = partitionOffsetHighestContinuousSucceeded.get(tp);
+                                originalMarks.put(tp, previousOffset);
+                            }
+                            partitionOffsetHighestContinuousSucceeded.put(tp, thisOffset);
+                        } else {
+                            partitionNowFormsAContinuousBlock.put(tp, false);
+//                        Long old = partitionOffsetHighestContinuousCompleted.get(tp);
+                        }
+//                    else {
+//                        // easy, yes it's continuous, as there's no gap from previous highest
+//                        partitionNowFormsAContinuousBlock.put(tp, true);
+//                        partitionOffsetHighestContinuousCompleted.put(tp, thisOffset);
+//                    }
+                    }
+                }
+            }
+
+            //
+            {
+                handleFutureResult(work);
+            }
+
+        }
+        for (final TopicPartition tp : partitionsSeenForLogging) {
+            Long oldOffset = originalMarks.get(tp);
+            Long newOffset = partitionOffsetHighestContinuousSucceeded.get(tp);
+            log.debug("Low water mark (highest continuous completed) for partition {} moved from {} to {}, highest succeeded {}",
+                    tp, oldOffset, newOffset, partitionOffsetHighestSucceeded.get(tp));
+        }
+    }
+
+    /**
+     * Update highest Succeeded seen so far
+     */
+    private void updateHighestSucceededOffsetSoFar(final WorkContainer<K, V> work) {
+        //
+        TopicPartition tp = work.getTopicPartition();
+        Long highestCompleted = partitionOffsetHighestSucceeded.getOrDefault(tp, -1L);
+        long thisOffset = work.getCr().offset();
+        if (thisOffset > highestCompleted) {
+            log.trace("Updating highest completed - was: {} now: {}", highestCompleted, thisOffset);
+            partitionOffsetHighestSucceeded.put(tp, thisOffset);
+        }
+    }
+
+    /**
+     * Make encoders add new work result to their encodings
+     * <p>
+     * todo refactor to offset manager?
+     */
+    private void encodeWorkResult(final boolean offsetComplete, final WorkContainer<K, V> wc) {
+        TopicPartition tp = wc.getTopicPartition();
+        long lowWaterMark = partitionOffsetHighestContinuousSucceeded.get(tp);
+        Long highestCompleted = partitionOffsetHighestSucceeded.get(tp);
+
+        long nextExpectedOffsetFromBroker = lowWaterMark + 1;
+
+        OffsetSimultaneousEncoder offsetSimultaneousEncoder = partitionContinuousOffsetEncoders.get(tp);
+
+        long offset = wc.offset();
+
+        // give encoders chance to truncate
+        offsetSimultaneousEncoder.maybeReinitialise(nextExpectedOffsetFromBroker, highestCompleted);
+
+        if (offset <= nextExpectedOffsetFromBroker) {
+            // skip - nothing to encode
+            return;
+        }
+
+        long relativeOffset = offset - nextExpectedOffsetFromBroker;
+        if (relativeOffset < 0) {
+//            throw new InternalRuntimeError(msg("Relative offset negative {}", relativeOffset));
+            log.trace("Offset {} now below low water mark {}, no need to encode", offset, lowWaterMark);
+            return;
+        }
+
+        if (offsetComplete)
+            offsetSimultaneousEncoder.encodeCompleteOffset(nextExpectedOffsetFromBroker, relativeOffset, highestCompleted);
+        else
+            offsetSimultaneousEncoder.encodeIncompleteOffset(nextExpectedOffsetFromBroker, relativeOffset, highestCompleted);
+    }
+
+    /**
+     * Todo: Does this need to be run per message of a a result set? or only once the batch has been finished, once per
+     * partition? As we can't change anything mid flight - only for the next round
+     */
+    private void manageOffsetEncoderSpaceRequirements() {
+        int perPartition = getMetadataSpaceAvailablePerPartition();
+        double tolerance = 0.7; // 90%
+
+        boolean anyPartitionsAreHalted = false;
+
+        // for each encoded partition so far, check if we're within tolerance of max space
+        for (final Map.Entry<TopicPartition, OffsetSimultaneousEncoder> entry : partitionContinuousOffsetEncoders.entrySet()) {
+            TopicPartition tp = entry.getKey();
+            OffsetSimultaneousEncoder encoder = entry.getValue();
+            int encodedSize = encoder.getEncodedSizeEstimate();
+
+            int allowed = (int) (perPartition * tolerance);
+
+            boolean moreMessagesAreAllowed = allowed > encodedSize;
+
+            boolean previousMessagesAllowedState = partitionMoreRecordsAllowedToProcess.get(tp);
+            // update partition with tolerance threshold crossed status
+            partitionMoreRecordsAllowedToProcess.put(tp, moreMessagesAreAllowed);
+            if (!moreMessagesAreAllowed && previousMessagesAllowedState) {
+                anyPartitionsAreHalted = true;
+                log.debug(msg("Back-pressure for {} activated, no more messages allowed, best encoder {} needs {} which is more than " +
+                                "calculated restricted space of {} (max: {}, tolerance {}%). Messages will be allowed again once messages " +
+                                "complete and encoding space required shrinks.",
+                        tp, encoder.getSmallestCodec(), encodedSize, allowed, perPartition, tolerance * 100));
+            } else if (moreMessagesAreAllowed && !previousMessagesAllowedState) {
+                log.trace("Partition is now unblocked, needed {}, allowed {}", encodedSize, allowed);
+            } else if (!moreMessagesAreAllowed && !previousMessagesAllowedState) {
+                log.trace("Partition {} still blocked for new message processing", tp);
+            }
+
+            boolean offsetEncodingAlreadyWontFitAtAll = encodedSize > perPartition;
+            if (offsetEncodingAlreadyWontFitAtAll) {
+                log.warn("Despite attempts, current offset encoding requirements are now above what will fit. Offset encoding " +
+                        "will be dropped for this round, but no more messages for this partition will be attempted until " +
+                        "messages complete successfully and the offset encoding space required shrinks again.");
+                log.warn(msg("Back-pressure for {} activated, no more messages allowed, best encoder {} needs {} which is more than calculated " +
+                                "restricted space of {} (max: {}, tolerance {}%). Messages will be allowed again once messages complete and encoding " +
+                                "space required shrinks.",
+                        tp, encoder.getSmallestCodec(), encodedSize, allowed, perPartition, tolerance * 100));
+            }
+
+        }
+        if (anyPartitionsAreHalted) {
+            log.debug("Some partitions were halted");
+        }
+    }
+
+    private int getMetadataSpaceAvailablePerPartition() {
+        int defaultMaxMetadataSize = OffsetMapCodecManager.DefaultMaxMetadataSize;
+        // TODO what else is the overhead in b64 encoding?
+        int maxMetadataSize = defaultMaxMetadataSize - OffsetEncoding.standardOverhead;
+        if (numberOfAssignedPartitions == 0) {
+            // no partitions assigned - all available
+            return maxMetadataSize;
+//            throw new InternalRuntimeError("Nothing assigned");
+        }
+        int perPartition = maxMetadataSize / numberOfAssignedPartitions;
+        return perPartition;
+    }
+
+    public void onFailure(WorkContainer<K, V> wc) {
+        //
         wc.fail(clock);
+
+        //
         putBack(wc);
+
+        //
+        encodeWorkResult(false, wc);
     }
 
     /**
@@ -505,82 +1145,119 @@ boolean hasCommittableOffsets() {
      * todo: refactor into smaller methods?
      */
     <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove(boolean remove) {
-        Map<TopicPartition, OffsetAndMetadata> offsetsToSend = new HashMap<>();
-        int count = 0;
+        if (!isDirty()) {
+            // nothing to commit
+            return UniMaps.of();
+        }
+
+        Map<TopicPartition, OffsetAndMetadata> offsetMetadataToCommit = new HashMap<>();
+        int totalPartitionQueueSizeForLogging = 0;
         int removed = 0;
         log.trace("Scanning for in order in-flight work that has completed...");
-        int totalOffsetMetaCharacterLength = 0;
+        int totalOffsetMetaCharacterLengthUsed = 0;
         for (final var partitionQueueEntry : partitionCommitQueues.entrySet()) {
-            TopicPartition topicPartitionKey = partitionQueueEntry.getKey();
-            log.trace("Starting scan of partition: {}", topicPartitionKey);
+            //
+            totalPartitionQueueSizeForLogging += partitionQueueEntry.getValue().size();
             var partitionQueue = partitionQueueEntry.getValue();
-            count += partitionQueue.size();
+
             var workToRemove = new LinkedList<WorkContainer<K, V>>();
-            var incompleteOffsets = new LinkedHashSet<Long>();
+            var incompleteOffsets = new LinkedHashSet<Long>();  // we only need to know the full incompletes when we do this scan, so find them only now, and discard
+
+            //
             long lowWaterMark = -1;
             // can't commit this offset or beyond, as this is the latest offset that is incomplete
             // i.e. only commit offsets that come before the current one, and stop looking for more
             boolean iteratedBeyondLowWaterMarkBeingLowestCommittableOffset = false;
+
+            //
+            TopicPartition topicPartitionKey = partitionQueueEntry.getKey();
+            log.trace("Starting scan of partition: {}", topicPartitionKey);
+            Long firstIncomplete = null;
+            Long baseOffset = partitionOffsetHighestContinuousSucceeded.get(topicPartitionKey);
             for (final var offsetAndItsWorkContainer : partitionQueue.entrySet()) {
                 // ordered iteration via offset keys thanks to the tree-map
-                WorkContainer<K, V> container = offsetAndItsWorkContainer.getValue();
-                long offset = container.getCr().offset();
-                boolean complete = container.isUserFunctionComplete();
-                if (complete) {
-                    if (container.getUserFunctionSucceeded().get() && !iteratedBeyondLowWaterMarkBeingLowestCommittableOffset) {
-                        log.trace("Found offset candidate ({}) to add to offset commit map", container);
-                        workToRemove.add(container);
+                WorkContainer<K, V> work = offsetAndItsWorkContainer.getValue();
+                boolean inFlight = !work.isNotInFlight(); // check is part of this mailbox set / not in flight
+                if (inFlight) {
+                    log.trace("Skipping comparing to work still in flight: {}", work);
+                    continue;
+                }
+                long offset = work.getCr().offset();
+                boolean workCompleted = work.isUserFunctionComplete();
+                if (workCompleted) {
+                    if (work.isUserFunctionSucceeded() && !iteratedBeyondLowWaterMarkBeingLowestCommittableOffset) {
+                        log.trace("Found offset candidate ({}) to add to offset commit map", work);
+                        workToRemove.add(work);
                         // as in flights are processed in order, this will keep getting overwritten with the highest offset available
                         // current offset is the highest successful offset, so commit +1 - offset to be committed is defined as the offset of the next expected message to be read
-                        long offsetOfNextExpectedMessageToBeCommitted = offset + 1;
-                        OffsetAndMetadata offsetData = new OffsetAndMetadata(offsetOfNextExpectedMessageToBeCommitted);
-                        offsetsToSend.put(topicPartitionKey, offsetData);
-                    } else if (container.getUserFunctionSucceeded().get() && iteratedBeyondLowWaterMarkBeingLowestCommittableOffset) {
+                        long offsetOfNextExpectedMessageAkaHighestCommittableAkaLowWaterMark = offset + 1;
+                        OffsetAndMetadata offsetData = new OffsetAndMetadata(offsetOfNextExpectedMessageAkaHighestCommittableAkaLowWaterMark);
+                        offsetMetadataToCommit.put(topicPartitionKey, offsetData);
+                    } else if (work.isUserFunctionSucceeded() && iteratedBeyondLowWaterMarkBeingLowestCommittableOffset) {
                         // todo lookup the low water mark and include here
                         log.trace("Offset {} is complete and succeeded, but we've iterated past the lowest committable offset ({}). Will mark as complete in the offset map.",
-                                container.getCr().offset(), lowWaterMark);
+                                work.getCr().offset(), lowWaterMark);
                         // no-op - offset map is only for not succeeded or completed offsets
 //                        // mark as complete complete so remove from work
-//                        workToRemove.add(container);
+//                        workToRemove.add(work);
                     } else {
-                        log.trace("Offset {} is complete, but failed processing. Will track in offset map as not complete. Can't do normal offset commit past this point.", container.getCr().offset());
+                        log.trace("Offset {} is complete, but failed processing. Will track in offset map as not complete. Can't do normal offset commit past this point.", work.getCr().offset());
                         iteratedBeyondLowWaterMarkBeingLowestCommittableOffset = true;
                         incompleteOffsets.add(offset);
+                        if (firstIncomplete == null)
+                            firstIncomplete = offset;
                     }
                 } else {
-                    lowWaterMark = container.offset();
+                    lowWaterMark = work.offset();
+
+                    // work not complete - either successfully or unsuccessfully
                     iteratedBeyondLowWaterMarkBeingLowestCommittableOffset = true;
                     log.trace("Offset ({}) is incomplete, holding up the queue ({}) of size {}.",
-                            container.getCr().offset(),
+                            work.getCr().offset(),
                             partitionQueueEntry.getKey(),
                             partitionQueueEntry.getValue().size());
                     incompleteOffsets.add(offset);
+                    if (firstIncomplete == null)
+                        firstIncomplete = offset;
                 }
             }
 
-            // offset map building
-            // Get final offset data, build the the offset map, and replace it in our map of offset data to send
-            // TODO potential optimisation: store/compare the current incomplete offsets to the last committed ones, to know if this step is needed or not (new progress has been made) - isdirty?
-            if (!incompleteOffsets.isEmpty()) {
-                long offsetOfNextExpectedMessage;
-                OffsetAndMetadata finalOffsetOnly = offsetsToSend.get(topicPartitionKey);
-                if (finalOffsetOnly == null) {
-                    // no new low water mark to commit, so use the last one again
-                    offsetOfNextExpectedMessage = incompleteOffsets.iterator().next(); // first element
-                } else {
-                    offsetOfNextExpectedMessage = finalOffsetOnly.offset();
-                }
-
-                OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(this, this.consumer);
-                try {
-                    String offsetMapPayload = om.makeOffsetMetadataPayload(offsetOfNextExpectedMessage, topicPartitionKey, incompleteOffsets);
-                    totalOffsetMetaCharacterLength += offsetMapPayload.length();
-                    OffsetAndMetadata offsetWithExtraMap = new OffsetAndMetadata(offsetOfNextExpectedMessage, offsetMapPayload);
-                    offsetsToSend.put(topicPartitionKey, offsetWithExtraMap);
-                } catch (EncodingNotSupportedException e) {
-                    log.warn("No encodings could be used to encode the offset map, skipping. Warning: messages might be replayed on rebalance", e);
-                }
-            }
+//            {
+//                OffsetSimultaneousEncoder precomputed = partitionContinuousOffsetEncoders.get(topicPartitionKey);
+//                byte[] bytes = new byte[0];
+//                try {
+//                    Long currentHighestCompleted = partitionOffsetHighestSucceeded.get(topicPartitionKey) + 1;
+//                    if (firstIncomplete != null && baseOffset != firstIncomplete - 1) {
+//                        log.warn("inconsistent base new vs old {} {} diff: {}", baseOffset, firstIncomplete, firstIncomplete - baseOffset);
+//                        if (baseOffset > firstIncomplete) {
+//                            log.warn("batch computed is higher than this scan??");
+//                        }
+//                    }
+//                    Long highestSeen = partitionOffsetHighestSeen.get(topicPartitionKey); // we don't expect these to be different
+//                    if (currentHighestCompleted != highestSeen) {
+//                        log.debug("New system upper end vs old system {} {} (delta: {})", currentHighestCompleted, highestSeen, highestSeen - currentHighestCompleted);
+//                    }
+//
+////                    precomputed.runOverIncompletes(incompleteOffsets, baseOffset, currentHighestCompleted);
+//                    precomputed.serializeAllEncoders();
+//
+//                    // make this a field instead - has no state?
+//                    OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(this, this.consumerMgr);
+//                    String smallestMetadataPacked = om.makeOffsetMetadataPayload(precomputed);
+//
+//                    totalOffsetMetaCharacterLengthUsed += smallestMetadataPacked.length();
+//                    log.debug("comparisonOffsetPayloadString :{}:", smallestMetadataPacked);
+//                    OffsetAndMetadata offsetWithExtraMap = new OffsetAndMetadata(baseOffset + 1, smallestMetadataPacked);
+//                    offsetMetadataToCommit.put(topicPartitionKey, offsetWithExtraMap);
+//                } catch (EncodingNotSupportedException e) {
+//                    e.printStackTrace();
+//                }
+
+//            OffsetAndMetadata offsetAndMetadata = offsetMetadataToCommit.get(topicPartitionKey);
+//            {
+//                int offsetMetaPayloadSpaceUsed = getTotalOffsetMetaCharacterLength(offsetMetadataToCommit, totalOffsetMetaCharacterLengthUsed, incompleteOffsets, topicPartitionKey);
+//                totalOffsetMetaCharacterLengthUsed += offsetMetaPayloadSpaceUsed;
+//            }
 
             if (remove) {
                 removed += workToRemove.size();
@@ -589,15 +1266,50 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
                     partitionQueue.remove(offset);
                 }
             }
+
         }
 
-        maybeStripOffsetPayload(offsetsToSend, totalOffsetMetaCharacterLength);
+        maybeStripOffsetPayload(offsetMetadataToCommit, totalOffsetMetaCharacterLengthUsed);
 
         log.debug("Scan finished, {} were in flight, {} completed offsets removed, coalesced to {} offset(s) ({}) to be committed",
-                count, removed, offsetsToSend.size(), offsetsToSend);
-        return offsetsToSend;
+                totalPartitionQueueSizeForLogging, removed, offsetMetadataToCommit.size(), offsetMetadataToCommit);
+        return offsetMetadataToCommit;
     }
 
+//    private int getTotalOffsetMetaCharacterLength(final Map<TopicPartition, OffsetAndMetadata> perPartitionNextExpectedOffset, int totalOffsetMetaCharacterLength, final LinkedHashSet<Long> incompleteOffsets, final TopicPartition topicPartitionKey) {
+//        // offset map building
+//        // Get final offset data, build the the offset map, and replace it in our map of offset data to send
+//        // TODO potential optimisation: store/compare the current incomplete offsets to the last committed ones, to know if this step is needed or not (new progress has been made) - isdirty?
+//        if (!incompleteOffsets.isEmpty()) {
+//            long offsetOfNextExpectedMessage;
+//            OffsetAndMetadata finalOffsetOnly = perPartitionNextExpectedOffset.get(topicPartitionKey);
+//            if (finalOffsetOnly == null) {
+//                // no new low water mark to commit, so use the last one again
+//                offsetOfNextExpectedMessage = incompleteOffsets.iterator().next(); // first element
+//            } else {
+//                offsetOfNextExpectedMessage = finalOffsetOnly.offset();
+//            }
+//
+//            OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(this, this.consumerMgr);
+//            try {
+//                // TODO change from offsetOfNextExpectedMessage to getting the pre computed one from offsetOfNextExpectedMessage
+//                Long highestCompletedOffset = partitionOffsetHighestSucceeded.get(topicPartitionKey);
+//                if (highestCompletedOffset == null) {
+//                    log.error("What now?");
+//                }
+//                // encode
+//                String offsetMapPayload = om.makeOffsetMetadataPayload(offsetOfNextExpectedMessage, topicPartitionKey, incompleteOffsets);
+//                totalOffsetMetaCharacterLength += offsetMapPayload.length();
+//                OffsetAndMetadata offsetWithExtraMap = new OffsetAndMetadata(offsetOfNextExpectedMessage, offsetMapPayload);
+//                perPartitionNextExpectedOffset.put(topicPartitionKey, offsetWithExtraMap);
+//            } catch (EncodingNotSupportedException e) {
+//                log.warn("No encodings could be used to encode the offset map, skipping. Warning: messages might be replayed on rebalance", e);
+////                backoffer.onFailure();
+//            }
+//        }
+//        return totalOffsetMetaCharacterLength;
+//    }
+
     /**
      * Once all the offset maps have been calculated, check if they're too big, and if so, remove all of them.
      * <p>
@@ -608,7 +1320,8 @@ <R> Map<TopicPartition, OffsetAndMetadata> findCompletedEligibleOffsetsAndRemove
      *
      * @see OffsetMapCodecManager#DefaultMaxMetadataSize
      */
-    private void maybeStripOffsetPayload(Map<TopicPartition, OffsetAndMetadata> offsetsToSend, int totalOffsetMetaCharacterLength) {
+    private void maybeStripOffsetPayload(Map<TopicPartition, OffsetAndMetadata> offsetsToSend,
+                                         int totalOffsetMetaCharacterLength) {
         // TODO: Potential optimisation: if max metadata size is shared across partitions, the limit used could be relative to the number of
         //  partitions assigned to this consumer. In which case, we could derive the limit for the number of downloaded but not committed
         //  offsets, from this max over some estimate. This way we limit the possibility of hitting the hard limit imposed in the protocol, thus
@@ -619,32 +1332,49 @@ private void maybeStripOffsetPayload(Map<TopicPartition, OffsetAndMetadata> offs
                     totalOffsetMetaCharacterLength);
             // strip all payloads
             // todo iteratively strip the largest payloads until we're under the limit
+            int totalSizeEstimates = 0;
             for (var entry : offsetsToSend.entrySet()) {
-                TopicPartition key = entry.getKey();
+                TopicPartition tp = entry.getKey();
+                OffsetSimultaneousEncoder offsetSimultaneousEncoder = partitionContinuousOffsetEncoders.get(tp);
+                int encodedSizeEstimate = offsetSimultaneousEncoder.getEncodedSizeEstimate();
+                log.debug("Estimate for {} {}", tp, encodedSizeEstimate);
+                totalSizeEstimates += encodedSizeEstimate;
                 OffsetAndMetadata v = entry.getValue();
                 OffsetAndMetadata stripped = new OffsetAndMetadata(v.offset()); // meta data gone
-                offsetsToSend.replace(key, stripped);
+                offsetsToSend.replace(tp, stripped);
             }
+            log.debug("Total estimate for all partitions {}", totalSizeEstimates);
+//            backoffer.onFailure();
         } else if (totalOffsetMetaCharacterLength != 0) {
             log.debug("Offset map small enough to fit in payload: {} (max: {})", totalOffsetMetaCharacterLength, OffsetMapCodecManager.DefaultMaxMetadataSize);
+//            backoffer.onSuccess();
         }
     }
 
     /**
-     * Truncate our tracked offsets as a commit was successful, so the low water mark rises, and we dont' need to track
+     * Called after a successful commit off offsets
+     */
+    public void onOffsetCommitSuccess(Map<TopicPartition, OffsetAndMetadata> offsetsCommitted) {
+        truncateOffsetsIncompleteMetadataPayloads(offsetsCommitted);
+        workStateIsDirtyNeedsCommitting.set(false);
+    }
+
+    /**
+     * Truncate our tracked offsets as a commit was successful, so the low water mark rises, and we don't need to track
      * as much anymore.
      * <p>
-     * When commits are made to broker, we can throw away all the individually tracked offsets before the committed
-     * offset.
+     * When commits are made to broker, we can throw away all the individually tracked offsets lower than the base
+     * offset which is in the commit.
      */
-    public void onOffsetCommitSuccess(Map<TopicPartition, OffsetAndMetadata> offsetsToSend) {
+    private void truncateOffsetsIncompleteMetadataPayloads(
+            final Map<TopicPartition, OffsetAndMetadata> offsetsCommitted) {
         // partitionOffsetHighWaterMarks this will get overwritten in due course
-        offsetsToSend.forEach((tp, meta) -> {
-            Set<Long> offsets = partitionIncompleteOffsets.get(tp);
-            boolean trackedOffsetsForThisPartitionExist = offsets != null;
+        offsetsCommitted.forEach((tp, meta) -> {
+            Set<Long> incompleteOffsets = partitionOffsetsIncompleteMetadataPayloads.get(tp);
+            boolean trackedOffsetsForThisPartitionExist = incompleteOffsets != null;
             if (trackedOffsetsForThisPartitionExist) {
                 long newLowWaterMark = meta.offset();
-                offsets.removeIf(offset -> offset < newLowWaterMark);
+                incompleteOffsets.removeIf(offset -> offset < newLowWaterMark);
             }
         });
     }
@@ -716,4 +1446,44 @@ public boolean hasWorkInCommitQueues() {
         }
         return false;
     }
+
+    public Map<TopicPartition, OffsetAndMetadata> serialiseEncoders() {
+        if (!isDirty()) {
+            log.trace("Nothing to commit, work state is clean");
+            return UniMaps.of();
+        }
+
+        Map<TopicPartition, OffsetAndMetadata> offsetMetadataToCommit = new HashMap<>();
+//        int totalPartitionQueueSizeForLogging = 0;
+        int totalOffsetMetaCharacterLengthUsed = 0;
+
+        for (final Map.Entry<TopicPartition, OffsetSimultaneousEncoder> tpEncoder : partitionContinuousOffsetEncoders.entrySet()) {
+            TopicPartition topicPartitionKey = tpEncoder.getKey();
+            OffsetSimultaneousEncoder precomputed = tpEncoder.getValue();
+            log.trace("Serialising available encoders for {} using {}", topicPartitionKey, precomputed);
+            try {
+                precomputed.serializeAllEncoders();
+
+                OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(this, this.consumerMgr);
+                String smallestMetadataPacked = om.makeOffsetMetadataPayload(precomputed);
+
+                totalOffsetMetaCharacterLengthUsed += smallestMetadataPacked.length();
+
+                long nextExpectedOffsetFromBroker = precomputed.getBaseOffset();
+                OffsetAndMetadata offsetWithExtraMap = new OffsetAndMetadata(nextExpectedOffsetFromBroker, smallestMetadataPacked);
+                offsetMetadataToCommit.put(topicPartitionKey, offsetWithExtraMap);
+            } catch (EncodingNotSupportedException e) {
+                log.warn("No encodings could be used to encode the offset map, skipping. Warning: messages might be replayed on rebalance", e);
+//                backoffer.onFailure();
+            }
+        }
+
+        maybeStripOffsetPayload(offsetMetadataToCommit, totalOffsetMetaCharacterLengthUsed);
+
+        log.debug("Scan finished, coalesced to {} offset(s) ({}) to be committed",
+                offsetMetadataToCommit.size(), offsetMetadataToCommit);
+
+        return offsetMetadataToCommit;
+    }
+
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
index ce17c9bec..06f8d35b7 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
@@ -4,11 +4,11 @@
  */
 package io.confluent.parallelconsumer.integrationTests;
 
+import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import io.confluent.parallelconsumer.OffsetMapCodecManager;
 import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils;
-import io.confluent.csid.utils.Range;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.*;
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
index 2abb60ec2..2245784b7 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
@@ -12,7 +12,6 @@
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import me.tongfei.progressbar.ProgressBar;
-import me.tongfei.progressbar.ProgressBarBuilder;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.clients.producer.MockProducer;
@@ -78,7 +77,7 @@ public void load(CommitMode commitMode) {
         //
         allMessagesConsumedLatch.await(defaultTimeoutSeconds, SECONDS);
 //        waitAtMost(defaultTimeout).until(() -> producerSpy.consumerGroupOffsetsHistory().size() > 0);
-        parallelConsumer.waitForProcessedNotCommitted(defaultTimeout.multipliedBy(10));
+        parallelConsumer.waitForProcessedNotCommitted(defaultTimeout);
         parallelConsumer.close();
 
         // assert quantity of produced messages
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
index b7e9194c2..21c187499 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
@@ -4,6 +4,8 @@
  */
 package io.confluent.parallelconsumer.integrationTests;
 
+import io.confluent.csid.utils.ProgressBarUtils;
+import io.confluent.csid.utils.ProgressTracker;
 import io.confluent.csid.utils.ProgressBarUtils;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
@@ -102,11 +104,14 @@ void asyncConsumeAndProcess() {
             });
 
             // keep checking how many message's we've processed
-            await().atMost(ofSeconds(60)).until(() -> {
-                // log.debug("msg count: {}", msgCount.get());
-                pb.stepTo(msgCount.get());
-                return msgCount.get() >= total;
-            });
+            ProgressTracker progress = new ProgressTracker(msgCount);
+            await().atMost(ofSeconds(60))
+                    .failFast(progress::hasProgressNotBeenMade, progress::constructError)
+                    .until(() -> {
+                        // log.debug("msg count: {}", msgCount.get());
+                        pb.stepTo(msgCount.get());
+                        return msgCount.get() >= total;
+                    });
         }
         async.close();
     }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
index 0f2cb909f..e2c04fa71 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/TransactionAndCommitModeTest.java
@@ -34,9 +34,11 @@
 import java.util.stream.Collectors;
 import java.util.stream.IntStream;
 
-import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.*;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.*;
+import static io.confluent.csid.utils.StringUtils.msg;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.TRANSACTIONAL_PRODUCER;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static java.time.Duration.ofSeconds;
 import static org.assertj.core.api.Assertions.*;
 import static org.awaitility.Awaitility.waitAtMost;
@@ -206,6 +208,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order,
         ProgressTracker pt = new ProgressTracker(processedCount, roundsAllowed);
         var failureMessage = msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
                 expectedMessageCount, commitMode, order, maxPoll);
+
         try {
             waitAtMost(ofSeconds(2000))
 //                    .failFast(() -> pc.isClosedOrFailed() // needs fail-fast feature in 4.0.4 - https://github.com/awaitility/awaitility/pull/193
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
index 0b8eca9cc..f455426f3 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/VeryLargeMessageVolumeTest.java
@@ -55,10 +55,10 @@ public class VeryLargeMessageVolumeTest extends BrokerIntegrationTest<String, St
 
     int HIGH_MAX_POLL_RECORDS_CONFIG = 10_000;
 
-    public List<String> consumedKeys = Collections.synchronizedList(new ArrayList<>());
-    public List<String> producedKeysAcknowledged = Collections.synchronizedList(new ArrayList<>());
-    public AtomicInteger processedCount = new AtomicInteger(0);
-    public AtomicInteger producedCount = new AtomicInteger(0);
+    List<String> consumedKeys = Collections.synchronizedList(new ArrayList<>());
+    List<String> producedKeysAcknowledged = Collections.synchronizedList(new ArrayList<>());
+    AtomicInteger processedCount = new AtomicInteger(0);
+    AtomicInteger producedCount = new AtomicInteger(0);
 
 
     /**
@@ -70,6 +70,7 @@ public class VeryLargeMessageVolumeTest extends BrokerIntegrationTest<String, St
      */
     @Test
     public void shouldNotThrowBitsetTooLongException() {
+        // TODO compare key to partition to unordered
         runTest(HIGH_MAX_POLL_RECORDS_CONFIG, CommitMode.CONSUMER_ASYNCHRONOUS, ProcessingOrder.KEY);
     }
 
@@ -80,8 +81,9 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
         // pre-produce messages to input-topic
         List<String> expectedKeys = new ArrayList<>();
-//        int expectedMessageCount = 2_000_000;
-        int expectedMessageCount = 100_0000;
+        int expectedMessageCount = 1_000_000;
+//        int expectedMessageCount = 100_000;
+//        int expectedMessageCount = 1_000_0;
         log.info("Producing {} messages before starting test", expectedMessageCount);
         List<Future<RecordMetadata>> sends = new ArrayList<>();
         try (Producer<String, String> kafkaProducer = kcu.createNewProducer(false)) {
@@ -132,20 +134,19 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
 
         ProgressBar bar = ProgressBarUtils.getNewMessagesBar(log, expectedMessageCount);
         pc.pollAndProduce(record -> {
-//                    try {
+                    try {
+                        // 1/5 chance of taking a long time
+                        int chance = 10;
+                        int dice = RandomUtils.nextInt(0, chance);
+                        if (dice == 0) {
+                            Thread.sleep(100);
+                        } else {
+                            Thread.sleep(RandomUtils.nextInt(3, 20));
+                        }
 //                        Thread.sleep(5);
-//                    } catch (InterruptedException e) {
-//                        e.printStackTrace();
-//                    }
-//                    try {
-//                        // 1/5 chance of taking a long time
-//                        int chance = 10;
-//                        int dice = RandomUtils.nextInt(0, chance);
-//                        if (dice == 0) {
-//                            Thread.sleep(100);
-//                        } else {
-//                            Thread.sleep(RandomUtils.nextInt(3, 20));
-//                        }
+                    } catch (InterruptedException e) {
+                        e.printStackTrace();
+                    }
                     bar.stepBy(1);
                     consumedKeys.add(record.key());
                     processedCount.incrementAndGet();
@@ -163,7 +164,7 @@ private void runTest(int maxPoll, CommitMode commitMode, ProcessingOrder order)
                 expectedMessageCount, commitMode, order, maxPoll);
         try {
             waitAtMost(ofSeconds(1200))
-//                    .failFast(() -> pc.isClosedOrFailed(), () -> pc.getFailureCause()) // requires https://github.com/awaitility/awaitility/issues/178#issuecomment-734769761
+                    .failFast(() -> pc.isClosedOrFailed(), () -> pc.getFailureCause()) // requires https://github.com/awaitility/awaitility/issues/178#issuecomment-734769761
                     .alias(failureMessage)
                     .pollInterval(1, SECONDS)
                     .untilAsserted(() -> {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
index fc5327c80..39adcebf3 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
@@ -18,7 +18,7 @@
 import org.apache.kafka.common.TopicPartition;
 import org.assertj.core.api.Assertions;
 import org.assertj.core.util.Lists;
-import pl.tlinkowski.unij.api.UniLists;
+import pl.tlinkowski.unij.api.UniSets;
 
 import java.util.*;
 import java.util.concurrent.FutureTask;
@@ -259,7 +259,8 @@ public static void completeWork(final WorkManager<String, String> wmm, final Wor
         assertThat(future).isDone();
         wc.setFuture(future);
         wc.onUserFunctionSuccess();
-        wmm.success(wc);
+//        wmm.onSuccess(wc);
+        wmm.onResultBatch(UniSets.of(wc));
         assertThat(wc.isUserFunctionComplete()).isTrue();
     }
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
index 798ff44c6..533a74c3b 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
@@ -109,11 +109,7 @@ public synchronized void close(final long timeout, final TimeUnit unit) {
      * @see io.confluent.parallelconsumer.ParallelEoSStreamProcessor#onPartitionsRevoked
      */
     private void revokeAssignment() throws NoSuchFieldException, IllegalAccessException {
-        // access listener
-        Field subscriptionsField = MockConsumer.class.getDeclaredField("subscriptions"); //NoSuchFieldException
-        subscriptionsField.setAccessible(true);
-        SubscriptionState subscriptionState = (SubscriptionState) subscriptionsField.get(this); //IllegalAccessException
-        ConsumerRebalanceListener consumerRebalanceListener = subscriptionState.rebalanceListener();
+        ConsumerRebalanceListener consumerRebalanceListener = getRebalanceListener();
 
         // execute
         if (consumerRebalanceListener == null) {
@@ -124,12 +120,22 @@ private void revokeAssignment() throws NoSuchFieldException, IllegalAccessExcept
         }
     }
 
+    private ConsumerRebalanceListener getRebalanceListener() throws NoSuchFieldException, IllegalAccessException {
+        // access listener
+        Field subscriptionsField = MockConsumer.class.getDeclaredField("subscriptions"); //NoSuchFieldException
+        subscriptionsField.setAccessible(true);
+        SubscriptionState subscriptionState = (SubscriptionState) subscriptionsField.get(this); //IllegalAccessException
+        ConsumerRebalanceListener consumerRebalanceListener = subscriptionState.rebalanceListener();
+        return consumerRebalanceListener;
+    }
+
     public void subscribeWithRebalanceAndAssignment(final List<String> topics, int partitions) {
         List<TopicPartition> topicPartitions = topics.stream()
                 .flatMap(y -> Range.rangeStream(partitions).boxed()
                         .map(x -> new TopicPartition(y, x)))
                 .collect(Collectors.toList());
-        super.rebalance(topicPartitions);
+        rebalance(topicPartitions);
+
         //
         HashMap<TopicPartition, Long> beginningOffsets = new HashMap<>();
         for (var tp : topicPartitions) {
@@ -138,4 +144,13 @@ public void subscribeWithRebalanceAndAssignment(final List<String> topics, int p
         super.updateBeginningOffsets(beginningOffsets);
     }
 
+    @SneakyThrows
+    @Override
+    public synchronized void rebalance(final Collection<TopicPartition> newAssignment) {
+        super.rebalance(newAssignment);
+        ConsumerRebalanceListener rebalanceListeners = getRebalanceListener();
+        if (rebalanceListeners != null) {
+            rebalanceListeners.onPartitionsAssigned(newAssignment);
+        }
+    }
 }
\ No newline at end of file
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java
new file mode 100644
index 000000000..8973a5c6c
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java
@@ -0,0 +1,10 @@
+package io.confluent.csid.utils;
+
+import lombok.SneakyThrows;
+
+public class ThreadUtils {
+    @SneakyThrows
+    public static void sleepQueietly(final int ms) {
+        Thread.sleep(ms);
+    }
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
new file mode 100644
index 000000000..835847f02
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BackPressureTests.java
@@ -0,0 +1,83 @@
+package io.confluent.parallelconsumer;
+
+import io.confluent.csid.utils.KafkaTestUtils;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.clients.consumer.ConsumerRecords;
+import org.apache.kafka.common.TopicPartition;
+import org.junit.jupiter.api.Test;
+
+import java.util.Collections;
+import java.util.Comparator;
+import java.util.HashMap;
+import java.util.List;
+
+import static org.assertj.core.api.Assertions.assertThat;
+
+public class BackPressureTests extends ParallelEoSStreamProcessorTestBase {
+
+//    /**
+//     * Tests that the backpressure system works correctly
+//     * - that when max queued messages are reached, more aren't queued up
+//     * - that more records aren't added for processing than are desired via settings.
+//     */
+//    @Test
+//    void backPressureShouldPreventTooManyMessagesBeingQueuedForProcessing() {
+//        // mock messages downloaded for processing > MAX_TO_QUEUE
+//        // make sure work manager doesn't queue more than MAX_TO_QUEUE
+//        final int numRecords = 1_000;
+//
+//        //
+//        int maxInFlight = 200;
+//        int maxQueue = 100;
+//        ParallelConsumerOptions<String, String> build = ParallelConsumerOptions.<String, String>builder()
+////                .softMaxNumberMessagesBeyondBaseCommitOffset(maxInFlight)
+////                .maxMessagesToQueue(maxQueue)
+//                .build();
+//        WorkManager<String, String> wm = new WorkManager<>(build, consumerManager);
+//
+//        // add records
+//        {
+//            ConsumerRecords<String, String> crs = buildConsumerRecords(numRecords);
+//            wm.registerWork(crs);
+//        }
+//
+//        //
+//        {
+//            List<WorkContainer<String, String>> work = wm.maybeGetWork();
+//            assertThat(work).hasSize(maxQueue);
+//            assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(maxInFlight);
+//
+//            KafkaTestUtils.completeWork(wm, work, 50);
+//            KafkaTestUtils.completeWork(wm, work, 55);
+//        }
+//
+//        // add more records
+//        {
+//            assertThat(wm.shouldThrottle()).isTrue();
+//            assertThat(wm.isSufficientlyLoaded()).isTrue();
+//            ConsumerRecords<String, String> crs = buildConsumerRecords(numRecords);
+//            wm.registerWork(crs);
+//            assertThat(wm.getNumberOfEntriesInPartitionQueues()).as("Hasn't increased").isEqualTo(maxInFlight);
+//        }
+//
+//        // get more work
+//        {
+//            List<WorkContainer<String, String>> workContainers = wm.maybeGetWork();
+//            assertThat(workContainers).hasSize(2);
+//            assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(maxInFlight);
+//            assertThat(wm.shouldThrottle()).isTrue();
+//            assertThat(wm.isSufficientlyLoaded()).isTrue();
+//        }
+//    }
+
+    private ConsumerRecords<String, String> buildConsumerRecords(final int numRecords) {
+        List<ConsumerRecord<String, String>> consumerRecords = ktu.generateRecords(numRecords);
+        Collections.sort(consumerRecords, Comparator.comparingLong(ConsumerRecord::offset));
+        HashMap<TopicPartition, List<ConsumerRecord<String, String>>> recordsMap = new HashMap<>();
+        TopicPartition tp = new TopicPartition(INPUT_TOPIC, 0);
+        recordsMap.put(tp, consumerRecords);
+        ConsumerRecords<String, String> crs = new ConsumerRecords<>(recordsMap);
+        return crs;
+    }
+
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BitSetEncoderTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BitSetEncoderTest.java
new file mode 100644
index 000000000..1dc51294d
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/BitSetEncoderTest.java
@@ -0,0 +1,70 @@
+package io.confluent.parallelconsumer;
+
+import lombok.SneakyThrows;
+import org.junit.jupiter.api.Test;
+
+import static org.assertj.core.api.Assertions.assertThat;
+
+public class BitSetEncoderTest {
+
+    @SneakyThrows
+    @Test
+    void general() {
+        long highest = 0L;
+        long base = 0;
+
+        BitsetEncoder o = new BitsetEncoder(0, 0, new OffsetSimultaneousEncoder(0, 0L));
+
+        // offset 0 is missing
+
+        highest++;
+        o.encodeCompleteOffset(base, highest, highest);
+        {
+            long[] actual = o.bitSet.stream().asLongStream().toArray();
+            assertThat(actual).doesNotContain(0).contains(1);
+        }
+
+        {
+            highest++;
+            o.encodeCompleteOffset(base, highest, highest);
+            long[] actual = o.bitSet.stream().asLongStream().toArray();
+            assertThat(actual).doesNotContain(0).contains(1, 2);
+        }
+
+
+        {
+            highest++;
+            highest++;
+            o.encodeCompleteOffset(base, highest, highest);
+            long[] actual = o.bitSet.stream().asLongStream().toArray();
+            assertThat(actual).doesNotContain(0).contains(1, 2, 4);
+        }
+    }
+
+
+    @SneakyThrows
+    @Test
+    void maybeReinitalise() {
+        long highest = 0L;
+        long base = 0;
+
+        BitsetEncoder o = new BitsetEncoder(0, 0, new OffsetSimultaneousEncoder(0, 0L));
+
+        //
+        o.encodeCompleteOffset(base, highest, highest);
+
+        highest++;
+        o.encodeCompleteOffset(base, highest, highest);
+        {
+            long[] actual = o.bitSet.stream().asLongStream().toArray();
+            assertThat(actual).contains(1);
+        }
+
+        {
+            highest++;
+            o.maybeReinitialise(base, highest);
+            long[] actual = o.bitSet.stream().asLongStream().toArray();
+            assertThat(actual).as("still contains it's information").contains(1);
+        }
+    }
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ContinuousEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ContinuousEncodingTests.java
new file mode 100644
index 000000000..d5bb75acb
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ContinuousEncodingTests.java
@@ -0,0 +1,271 @@
+package io.confluent.parallelconsumer;
+
+import io.confluent.csid.utils.KafkaTestUtils;
+import io.confluent.csid.utils.ProgressBarUtils;
+import io.confluent.csid.utils.TrimListRepresentation;
+import lombok.SneakyThrows;
+import lombok.extern.slf4j.Slf4j;
+import me.tongfei.progressbar.ProgressBar;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.clients.consumer.ConsumerRecords;
+import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import org.apache.kafka.common.TopicPartition;
+import org.assertj.core.api.Assertions;
+import org.junit.jupiter.api.Test;
+import org.junit.jupiter.params.ParameterizedTest;
+import org.junit.jupiter.params.provider.EnumSource;
+import org.junit.jupiter.params.provider.ValueSource;
+import pl.tlinkowski.unij.api.UniSets;
+
+import java.nio.ByteBuffer;
+import java.time.Duration;
+import java.util.*;
+import java.util.concurrent.BrokenBarrierException;
+import java.util.function.Consumer;
+import java.util.stream.Collectors;
+
+import static io.confluent.parallelconsumer.OffsetEncoding.ByteArray;
+import static io.confluent.parallelconsumer.OffsetEncoding.ByteArrayCompressed;
+import static java.time.Duration.ofSeconds;
+import static org.assertj.core.api.Assertions.assertThat;
+import static org.assertj.core.api.Assertions.assertThatThrownBy;
+import static org.awaitility.Awaitility.await;
+import static org.hamcrest.Matchers.in;
+import static org.hamcrest.Matchers.not;
+import static org.junit.Assume.assumeThat;
+import static org.junit.jupiter.api.Assertions.fail;
+import static pl.tlinkowski.unij.api.UniLists.of;
+
+@Slf4j
+public class ContinuousEncodingTests extends ParallelEoSStreamProcessorTestBase {
+
+//    @SneakyThrows
+//    @ParameterizedTest
+//    @ValueSource(longs = {
+//            10_000L,
+//            100_000L,
+//            100_000_000L, // slow
+//    })
+//    void largeIncompleteOffsetValues(long currentHighestCompleted) {
+//        var incompletes = new HashSet<Long>();
+//        long lowWaterMark = 123L;
+//        incompletes.addAll(UniSets.of(lowWaterMark, 2345L, 8765L));
+//
+//        OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(lowWaterMark, currentHighestCompleted);
+//        encoder.compressionForced = true;
+//
+//        //
+//        encoder.runOverIncompletes(incompletes, lowWaterMark, currentHighestCompleted);
+//        Map<OffsetEncoding, byte[]> encodingMap = encoder.getEncodingMap();
+//
+//        //
+//        byte[] smallestBytes = encoder.packSmallest();
+//        EncodedOffsetData unwrap = EncodedOffsetData.unwrap(smallestBytes);
+//        ParallelConsumer.Tuple<Long, Set<Long>> decodedIncompletes = unwrap.getDecodedIncompletes(lowWaterMark);
+//        assertThat(decodedIncompletes.getRight()).containsExactlyInAnyOrderElementsOf(incompletes);
+//
+//        //
+//        for (OffsetEncoding encodingToUse : OffsetEncoding.values()) {
+//            log.info("Testing {}", encodingToUse);
+//            byte[] bitsetBytes = encodingMap.get(encodingToUse);
+//            if (bitsetBytes != null) {
+//                EncodedOffsetData bitsetUnwrap = EncodedOffsetData.unwrap(encoder.packEncoding(new EncodedOffsetData(encodingToUse, ByteBuffer.wrap(bitsetBytes))));
+//                ParallelConsumer.Tuple<Long, Set<Long>> decodedBitsets = bitsetUnwrap.getDecodedIncompletes(lowWaterMark);
+//                assertThat(decodedBitsets.getRight())
+//                        .as(encodingToUse.toString())
+//                        .containsExactlyInAnyOrderElementsOf(incompletes);
+//            } else {
+//                log.info("Encoding not performed: " + encodingToUse);
+//            }
+//        }
+//    }
+
+    @SneakyThrows
+    @ParameterizedTest
+    @EnumSource(OffsetEncoding.class)
+    void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(OffsetEncoding encoding) throws BrokenBarrierException, InterruptedException {
+        assumeThat("Codec skipped, not applicable", encoding,
+                not(in(of(ByteArray, ByteArrayCompressed)))); // byte array not currently used
+
+        OffsetMapCodecManager.forcedCodec = Optional.of(encoding);
+        OffsetSimultaneousEncoder.compressionForced = true;
+
+        var records = new ArrayList<ConsumerRecord<String, String>>();
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 0, "akey", "avalue")); // will complete
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 1, "akey", "avalue"));
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 4, "akey", "avalue"));
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 5, "akey", "avalue"));
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 69, "akey", "avalue")); // will complete
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 100, "akey", "avalue"));
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 1_000, "akey", "avalue"));
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 20_000, "akey", "avalue")); // near upper limit of Short.MAX_VALUE
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 25_000, "akey", "avalue")); // will complete, near upper limit of Short.MAX_VALUE
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 30_000, "akey", "avalue")); // near upper limit of Short.MAX_VALUE
+
+        // Extremely large tests for v2 encoders
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 40_000, "akey", "avalue")); // higher than Short.MAX_VALUE
+        int avoidOffByOne = 2;
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 40_000 + Short.MAX_VALUE + avoidOffByOne, "akey", "avalue")); // runlength higher than Short.MAX_VALUE
+
+//        int recsToRequestArbitrary = 10000;
+
+        var firstSucceededRecordRemoved = new ArrayList<>(records);
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 0).findFirst().get());
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 69).findFirst().get());
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 25_000).findFirst().get());
+
+        //
+        ktu.send(consumerSpy, records);
+
+        //
+        ParallelConsumerOptions options = parallelConsumer.getWm().getOptions();
+        HashMap<TopicPartition, List<ConsumerRecord<String, String>>> recordsMap = new HashMap<>();
+        TopicPartition tp = new TopicPartition(INPUT_TOPIC, 0);
+        recordsMap.put(tp, records);
+        ConsumerRecords<String, String> crs = new ConsumerRecords<>(recordsMap);
+
+        // write offsets
+        Map<TopicPartition, OffsetAndMetadata> completedEligibleOffsetsAndRemove;
+        {
+            WorkManager<String, String> wm = new WorkManager<>(options, consumerManager);
+            wm.registerWork(crs);
+
+            List<WorkContainer<String, String>> work = wm.maybeGetWork();
+
+            KafkaTestUtils.completeWork(wm, work, 0);
+
+            // test
+            assertThat(wm.partitionMoreRecordsAllowedToProcess.get(tp)).isFalse();
+
+            KafkaTestUtils.completeWork(wm, work, 69);
+
+            // test
+            assertThat(wm.partitionMoreRecordsAllowedToProcess.get(tp)).isFalse();
+
+
+            KafkaTestUtils.completeWork(wm, work, 25_000);
+
+            // test
+            assertThat(wm.partitionMoreRecordsAllowedToProcess.get(tp)).isFalse();
+
+            completedEligibleOffsetsAndRemove = wm.findCompletedEligibleOffsetsAndRemove();
+
+            // check for graceful fall back to the smallest available encoder
+            OffsetMapCodecManager<String, String> om = new OffsetMapCodecManager<>(wm, consumerManager);
+            Set<Long> collect = firstSucceededRecordRemoved.stream().map(x -> x.offset()).collect(Collectors.toSet());
+            OffsetMapCodecManager.forcedCodec = Optional.empty(); // turn off forced
+//            String bestPayload = om.makeOffsetMetadataPayload(1, tp, collect);
+            String bestPayload = om.makeOffsetMetadataPayload(new OffsetSimultaneousEncoder(0, 0L));
+            assertThat(bestPayload).isNotEmpty();
+        }
+        consumerSpy.commitSync(completedEligibleOffsetsAndRemove);
+
+        // read offsets
+        {
+            WorkManager<String, String> newWm = new WorkManager<>(options, consumerManager);
+            newWm.onPartitionsAssigned(UniSets.of(tp));
+            newWm.registerWork(crs);
+            List<WorkContainer<String, String>> workContainers = newWm.maybeGetWork();
+            switch (encoding) {
+                case BitSet, BitSetCompressed, // BitSetV1 both get a short overflow due to the length being too long
+                        BitSetV2, // BitSetv2 uncompressed is too large to fit in metadata payload
+                        RunLength, RunLengthCompressed // RunLength V1 max runlength is Short.MAX_VALUE
+                        -> {
+                    assertThatThrownBy(() ->
+                            assertThat(workContainers).extracting(WorkContainer::getCr)
+                                    .containsExactlyElementsOf(firstSucceededRecordRemoved))
+                            .hasMessageContaining("but some elements were not expected")
+                            .hasMessageContaining("offset = 25000");
+                }
+                default -> {
+                    assertThat(workContainers).extracting(WorkContainer::getCr).containsExactlyElementsOf(firstSucceededRecordRemoved);
+                }
+            }
+        }
+    }
+
+
+    /**
+     * Gaps may exist for certain race results
+     */
+    @Test
+    void testFullCycleWithGaps() {
+        var options = ParallelConsumerOptions.<String, String>builder()
+//                .numberOfThreads(1000)
+                .maxConcurrency(100)
+                .build();
+//        var pc = new ParallelEoSStreamProcessor<String, String>(options);
+//        var wm = new WorkManager<>(options, consumerSpy);
+        setupParallelConsumerInstance(options);
+
+        BrokerPollSystem.setLongPollTimeout(Duration.ofSeconds(2));
+
+//        int expected = 1_000_000;
+//        int expected = 100_000;
+        int expected = 20_000;
+//        int expected = 1_00;
+
+        List<ConsumerRecord<String, String>> consumerRecords = ktu.generateRecordsForKey(1, expected);
+        // remove a few records to create gaps
+        List<Integer> toRemove = of(4, 8, 15, 16, 17, 18, 19, 20, 60, 90);
+        List<ConsumerRecord<String, String>> filtered = consumerRecords.stream().filter(x -> !toRemove.contains((int) x.offset())).collect(Collectors.toList());
+        ktu.send(consumerSpy, filtered);
+
+
+//        BrokerPollSystem<String, String> stringStringBrokerPollSystem = new BrokerPollSystem<>(new ConsumerManager<>(consumerSpy), wm, pc, options);
+//        stringStringBrokerPollSystem.start();
+//
+////        ArrayBlockingQueue<Runnable> buffer = new ArrayBlockingQueue<>(options.getNumberOfThreads() * 3);
+//        LinkedBlockingQueue<Runnable> buffer = new LinkedBlockingQueue<>();
+//
+//        ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(options.getNumberOfThreads(), options.getNumberOfThreads(),
+//                0L, MILLISECONDS,
+//                buffer);
+//
+
+        Consumer<ConsumerRecord<String, String>> usersFunction = (rec) -> {
+//            log.info("user func sleep {}", rec.offset());
+            try {
+//                Thread.sleep(RandomUtils.nextInt(20, 200));
+                Thread.sleep(0);
+//                Thread.sleep(2);
+            } catch (InterruptedException e) {
+                e.printStackTrace();
+            }
+//            log.info("user func end");
+        };
+        Consumer<String> callback = (astring) -> {
+            log.info("user callback");
+        };
+
+//        rb.startRingBuffer(buffer, usersFunction, callback);
+
+//        var rb = new RingBufferManager<String, String>(options, wm, pc, threadPoolExecutor);
+        log.info("Starting");
+        parallelConsumer.poll(usersFunction);
+
+        ProgressBar bar = ProgressBarUtils.getNewMessagesBar(log, expected);
+
+        Assertions.useRepresentation(new TrimListRepresentation());
+        await().atMost(ofSeconds(60))
+                .failFast(() -> parallelConsumer.isClosedOrFailed(), () -> parallelConsumer.getFailureCause())
+                .untilAsserted(() -> {
+                    List<Map<TopicPartition, OffsetAndMetadata>> commitHistoryInt = consumerSpy.getCommitHistoryInt();
+                    assertThat(commitHistoryInt).isNotEmpty();
+                    long offset = commitHistoryInt.get(commitHistoryInt.size() - 1).entrySet().stream().findFirst().get().getValue().offset();
+                    bar.stepTo(successfulWork.size());// is going to dance around
+                    assertThat(offset).isEqualTo(expected);
+                });
+        bar.stepTo(expected);
+        bar.close();
+
+        parallelConsumer.close();
+    }
+
+    @Test
+    void testFullCycleGapsAndFailedRecordsMultiplePartitions() {
+        fail();
+    }
+
+
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingBackPressureTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingBackPressureTest.java
new file mode 100644
index 000000000..ba6eface9
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingBackPressureTest.java
@@ -0,0 +1,140 @@
+package io.confluent.parallelconsumer;
+
+import io.confluent.csid.utils.TrimListRepresentation;
+import lombok.SneakyThrows;
+import lombok.extern.slf4j.Slf4j;
+import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import org.assertj.core.api.Assertions;
+import org.junit.jupiter.api.Test;
+
+import java.util.List;
+import java.util.Optional;
+import java.util.Set;
+import java.util.TreeSet;
+import java.util.concurrent.CountDownLatch;
+import java.util.concurrent.atomic.AtomicInteger;
+
+import static io.confluent.csid.utils.ThreadUtils.sleepQueietly;
+import static java.time.Duration.ofSeconds;
+import static java.util.concurrent.TimeUnit.SECONDS;
+import static org.assertj.core.api.Assertions.assertThat;
+import static org.awaitility.Awaitility.await;
+import static org.awaitility.Awaitility.waitAtMost;
+
+@Slf4j
+public class OffsetEncodingBackPressureTest extends ParallelEoSStreamProcessorTestBase {
+
+    /**
+     * Tests that when required space for encoding offset becomes too large, back pressure is put into the system so
+     * that no further messages for the given partitions can be taken for processing, until more messages complete.
+     */
+    @SneakyThrows
+    @Test
+    void backPressureShouldPreventTooManyMessagesBeingQueuedForProcessing() {
+        // mock messages downloaded for processing > MAX_TO_QUEUE
+        // make sure work manager doesn't queue more than MAX_TO_QUEUE
+//        final int numRecords = 1_000_0;
+        final int numRecords = 1_00;
+
+        OffsetMapCodecManager.DefaultMaxMetadataSize = 40;
+        OffsetMapCodecManager.forcedCodec = Optional.of(OffsetEncoding.BitSetV2); // force one that takes a predictable large amount of space
+
+        //
+//        int maxConcurrency = 200;
+//        ParallelConsumerOptions<String, String> build = ParallelConsumerOptions.<String, String>builder()
+//                .commitMode(TRANSACTIONAL_PRODUCER)
+//                .maxConcurrency(maxConcurrency)
+//                .build();
+//        WorkManager<String, String> wm = new WorkManager<>(build, consumerManager);
+
+        ktu.send(consumerSpy, ktu.generateRecords(numRecords));
+
+        AtomicInteger processedCount = new AtomicInteger(0);
+        CountDownLatch msgLock = new CountDownLatch(1);
+        parallelConsumer.poll((rec) -> {
+            // block the partition to create bigger and bigger offset encoding blocks
+            if (rec.offset() == 0) {
+                log.debug("force first message to 'never' complete, causing a large offset encoding (lots of messages completing above the low water mark");
+                awaitLatch(msgLock, 60);
+                log.debug("very slow message awoken");
+            } else {
+                sleepQueietly(5);
+            }
+            processedCount.getAndIncrement();
+        });
+//
+//        // add records
+//        {
+//            ConsumerRecords<String, String> crs = buildConsumerRecords(numRecords);
+//            wm.registerWork(crs);
+//        }
+
+        // wait for all pre-produced messages to be processed and produced
+        Assertions.useRepresentation(new TrimListRepresentation());
+//        var failureMessage = StringUtils.msg("All keys sent to input-topic should be processed and produced, within time (expected: {} commit: {} order: {} max poll: {})",
+//                expectedMessageCount, commitMode, order, maxPoll);
+//        try {
+        waitAtMost(ofSeconds(1200))
+                .failFast(() -> parallelConsumer.isClosedOrFailed(), () -> parallelConsumer.getFailureCause()) // requires https://github.com/awaitility/awaitility/issues/178#issuecomment-734769761
+//                    .alias(failureMessage)
+                .pollInterval(1, SECONDS)
+                .untilAsserted(() -> {
+//                        log.trace("Processed-count: {}, Produced-count: {}", processedCount.get(), producedCount.get());
+//                        SoftAssertions all = new SoftAssertions();
+//                        all.assertThat(new ArrayList<>(consumedKeys)).as("all expected are consumed").hasSameSizeAs(expectedKeys);
+//                        all.assertThat(new ArrayList<>(producedKeysAcknowledged)).as("all consumed are produced ok ").hasSameSizeAs(expectedKeys);
+//                        all.assertAll();
+                    assertThat(processedCount.get()).isEqualTo(numRecords - 1);
+                });
+//        } catch (ConditionTimeoutException e) {
+//            fail(failureMessage + "\n" + e.getMessage());
+//        }
+
+        // assert commit ok
+        {
+            waitForSomeLoopCycles(1);
+            parallelConsumer.requestCommitAsap();
+            waitForSomeLoopCycles(1);
+            List<OffsetAndMetadata> offsetAndMetadataList = extractAllPartitionsOffsetsAndMetadataSequentially();
+            assertThat(offsetAndMetadataList).isNotEmpty();
+            OffsetAndMetadata offsetAndMetadata = offsetAndMetadataList.get(offsetAndMetadataList.size() - 1);
+            assertThat(offsetAndMetadata.offset()).isEqualTo(0L);
+            String metadata = offsetAndMetadata.metadata();
+            OffsetMapCodecManager.NextOffsetAndIncompletes longTreeSetTuple = OffsetMapCodecManager.deserialiseIncompleteOffsetMapFromBase64(0, metadata);
+            // todo naming here?
+            Long highestSucceeded = longTreeSetTuple.getNextExpectedOffset();
+            assertThat(highestSucceeded).isEqualTo(99L);
+            Set<Long> incompletes = longTreeSetTuple.getIncompleteOffsets();
+            assertThat(incompletes).isNotEmpty().contains(0L).doesNotContain(1L, 50L, 99L);
+        }
+
+        //
+        WorkManager<String, String> wm = parallelConsumer.wm;
+        Boolean partitionBlocked = !wm.partitionMoreRecordsAllowedToProcess.get(topicPartition);
+        assertThat(partitionBlocked).isTrue();
+
+        // feed more messages
+        ktu.send(consumerSpy, ktu.generateRecords(numRecords));
+
+        // assert partition blocked
+        waitForOneLoopCycle();
+        assertThat(wm.partitionMoreRecordsAllowedToProcess.get(topicPartition)).isFalse();
+
+        // release message that was blocking partition progression
+        msgLock.countDown();
+
+        // assert no partitions blocked
+        waitForOneLoopCycle();
+        await().untilAsserted(() -> assertThat(wm.partitionMoreRecordsAllowedToProcess.get(topicPartition)).isTrue());
+
+        // assert all committed
+        int nextExpectedOffsetAfterSubmittedWork = numRecords * 2;
+        await().untilAsserted(() -> assertThat(extractAllPartitionsOffsetsSequentially()).contains(nextExpectedOffsetAfterSubmittedWork));
+        await().untilAsserted(() -> assertThat(wm.partitionMoreRecordsAllowedToProcess.get(topicPartition)).isTrue());
+    }
+
+    @Test
+    void failedMessagesThatCanRetryDontDeadlockABlockedPartition() {
+    }
+
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
index 0ff25a84d..2e67ec187 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetEncodingTests.java
@@ -16,7 +16,6 @@
 import java.nio.ByteBuffer;
 import java.util.*;
 import java.util.concurrent.BrokenBarrierException;
-import java.util.concurrent.FutureTask;
 import java.util.stream.Collectors;
 
 import static io.confluent.parallelconsumer.OffsetEncoding.*;
@@ -65,21 +64,21 @@ void runLengthDeserialise() {
             100_000_0L,
 //            100_000_000L, // very~ slow
     })
-    void largeIncompleteOffsetValues(long nextExpectedOffset) {
+    void largeIncompleteOffsetValues(long currentHighestCompleted) {
         var incompletes = new HashSet<Long>();
         long lowWaterMark = 123L;
         incompletes.addAll(UniSets.of(lowWaterMark, 2345L, 8765L));
 
-        OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(lowWaterMark, nextExpectedOffset, incompletes);
+        OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(lowWaterMark, currentHighestCompleted);
         encoder.compressionForced = true;
 
         //
-        encoder.invoke();
+//        encoder.runOverIncompletes(incompletes, lowWaterMark, currentHighestCompleted);
         Map<OffsetEncoding, byte[]> encodingMap = encoder.getEncodingMap();
 
         //
         byte[] smallestBytes = encoder.packSmallest();
-        EncodedOffsetPair unwrap = EncodedOffsetPair.unwrap(smallestBytes);
+        EncodedOffsetData unwrap = EncodedOffsetData.unwrap(smallestBytes);
         ParallelConsumer.Tuple<Long, Set<Long>> decodedIncompletes = unwrap.getDecodedIncompletes(lowWaterMark);
         assertThat(decodedIncompletes.getRight()).containsExactlyInAnyOrderElementsOf(incompletes);
 
@@ -88,7 +87,7 @@ void largeIncompleteOffsetValues(long nextExpectedOffset) {
             log.info("Testing {}", encodingToUse);
             byte[] bitsetBytes = encodingMap.get(encodingToUse);
             if (bitsetBytes != null) {
-                EncodedOffsetPair bitsetUnwrap = EncodedOffsetPair.unwrap(encoder.packEncoding(new EncodedOffsetPair(encodingToUse, ByteBuffer.wrap(bitsetBytes))));
+                EncodedOffsetData bitsetUnwrap = EncodedOffsetData.unwrap(encoder.packEncoding(new EncodedOffsetData(encodingToUse, ByteBuffer.wrap(bitsetBytes))));
                 ParallelConsumer.Tuple<Long, Set<Long>> decodedBitsets = bitsetUnwrap.getDecodedIncompletes(lowWaterMark);
                 assertThat(decodedBitsets.getRight())
                         .as(encodingToUse.toString())
@@ -120,6 +119,11 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 1, "akey", "avalue"));
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 4, "akey", "avalue"));
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 5, "akey", "avalue"));
+
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 10, "akey", "avalue"));
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 11, "akey", "avalue"));
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 12, "akey", "avalue"));
+
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 69, "akey", "avalue")); // will complete
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 100, "akey", "avalue"));
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 1_000, "akey", "avalue"));
@@ -130,27 +134,40 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         // Extremely large tests for v2 encoders
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 40_000, "akey", "avalue")); // higher than Short.MAX_VALUE
         int avoidOffByOne = 2;
-        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 40_000 + Short.MAX_VALUE + avoidOffByOne, "akey", "avalue")); // runlength higher than Short.MAX_VALUE
+        int complete = 40_000 + Short.MAX_VALUE + avoidOffByOne;
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, complete, "akey", "avalue")); // runlength higher than Short.MAX_VALUE // will complete
+
+        int largeTwo = 40_000 + Short.MAX_VALUE + avoidOffByOne * 100;
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, largeTwo, "akey", "avalue")); // runlength higher than Short.MAX_VALUE // incomplete (should be ignored)
+
+//        int recsToRequestArbitrary = 10000;
 
         var firstSucceededRecordRemoved = new ArrayList<>(records);
         firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 0).findFirst().get());
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 4).findFirst().get());
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 10).findFirst().get());
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 11).findFirst().get());
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 12).findFirst().get());
         firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 69).findFirst().get());
         firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == 25_000).findFirst().get());
+        firstSucceededRecordRemoved.remove(firstSucceededRecordRemoved.stream().filter(x -> x.offset() == complete).findFirst().get());
 
         //
         ktu.send(consumerSpy, records);
 
-        //
+        // setup
         ParallelConsumerOptions options = parallelConsumer.getWm().getOptions();
         HashMap<TopicPartition, List<ConsumerRecord<String, String>>> recordsMap = new HashMap<>();
         TopicPartition tp = new TopicPartition(INPUT_TOPIC, 0);
         recordsMap.put(tp, records);
         ConsumerRecords<String, String> crs = new ConsumerRecords<>(recordsMap);
 
+
         // write offsets
         Map<TopicPartition, OffsetAndMetadata> completedEligibleOffsetsAndRemove;
         {
-            WorkManager<String, String> wmm = new WorkManager<>(options, consumerSpy);
+            WorkManager<String, String> wmm = new WorkManager<>(options, consumerManager);
+            wmm.onPartitionsAssigned(UniSets.of(new TopicPartition(INPUT_TOPIC, 0)));
             wmm.registerWork(crs);
 
             List<WorkContainer<String, String>> work = wmm.maybeGetWork();
@@ -158,37 +175,47 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
             KafkaTestUtils.completeWork(wmm, work, 0);
 
+            KafkaTestUtils.completeWork(wmm, work, 4);
+
+            KafkaTestUtils.completeWork(wmm, work, 10);
+            KafkaTestUtils.completeWork(wmm, work, 11);
+            KafkaTestUtils.completeWork(wmm, work, 12);
+
             KafkaTestUtils.completeWork(wmm, work, 69);
 
             KafkaTestUtils.completeWork(wmm, work, 25_000);
 
-            completedEligibleOffsetsAndRemove = wmm.findCompletedEligibleOffsetsAndRemove();
+            KafkaTestUtils.completeWork(wmm, work, complete);
 
+//            completedEligibleOffsetsAndRemove = wmm.findCompletedEligibleOffsetsAndRemove(); // old version
+            completedEligibleOffsetsAndRemove = wmm.serialiseEncoders(); // new version
+//            String bestPayload = topicPartitionOffsetAndMetadataMap.
             // check for graceful fall back to the smallest available encoder
-            OffsetMapCodecManager<String, String> om = new OffsetMapCodecManager<>(wmm, consumerSpy);
-            Set<Long> collect = firstSucceededRecordRemoved.stream().map(x -> x.offset()).collect(Collectors.toSet());
+//            OffsetMapCodecManager<String, String> om = new OffsetMapCodecManager<>(wmm, consumerManager);
+
+//            Set<Long> collect = firstSucceededRecordRemoved.stream().map(x -> x.offset()).collect(Collectors.toSet());
             OffsetMapCodecManager.forcedCodec = Optional.empty(); // turn off forced
-            String bestPayload = om.makeOffsetMetadataPayload(1, tp, collect);
-            assertThat(bestPayload).isNotEmpty();
+//            String bestPayload = om.makeOffsetMetadataPayload(1, tp, collect);
+//            assertThat(bestPayload).isNotEmpty();
         }
         consumerSpy.commitSync(completedEligibleOffsetsAndRemove);
 
         // read offsets
         {
-            WorkManager<String, String> newWm = new WorkManager<>(options, consumerSpy);
+            WorkManager<String, String> newWm = new WorkManager<>(options, consumerManager);
             newWm.onPartitionsAssigned(UniSets.of(tp));
             newWm.registerWork(crs);
             List<WorkContainer<String, String>> workContainers = newWm.maybeGetWork();
             switch (encoding) {
                 case BitSet, BitSetCompressed, // BitSetV1 both get a short overflow due to the length being too long
-                        BitSetV2, // BitSetv2 uncompressed is too large to fit in metadata payload
+                        BitSetV2, // BitSetv2 uncompressed is too large to fit in metadata payload, so the whole encoding is dropped ~9101 bytes (max ~4000)
                         RunLength, RunLengthCompressed // RunLength V1 max runlength is Short.MAX_VALUE
                         -> {
                     assertThatThrownBy(() ->
                             assertThat(workContainers).extracting(WorkContainer::getCr)
                                     .containsExactlyElementsOf(firstSucceededRecordRemoved))
-                            .hasMessageContaining("but some elements were not expected")
-                            .hasMessageContaining("offset = 25000");
+                            .hasMessageContaining("were not expected")
+                            .hasMessageContaining("offset = 20000");
                 }
                 default -> {
                     assertThat(workContainers).extracting(WorkContainer::getCr).containsExactlyElementsOf(firstSucceededRecordRemoved);
@@ -210,24 +237,24 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
     @SneakyThrows
     @Test
     void ensureEncodingGracefullyWorksWhenOffsetsArentSequentialTwo() {
-        long nextExpectedOffset = 101;
+        long currentHighestCompleted = 101;
         long lowWaterMark = 0;
         var incompletes = new HashSet<>(UniSets.of(1L, 4L, 5L, 100L));
 
-        OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(lowWaterMark, nextExpectedOffset, incompletes);
+        OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(lowWaterMark, currentHighestCompleted);
         encoder.compressionForced = true;
 
         //
-        encoder.invoke();
+//        encoder.runOverIncompletes(incompletes, lowWaterMark, currentHighestCompleted);
         Map<OffsetEncoding, byte[]> encodingMap = encoder.getEncodingMap();
 
         //
         byte[] smallestBytes = encoder.packSmallest();
-        EncodedOffsetPair unwrap = EncodedOffsetPair.unwrap(smallestBytes);
+        EncodedOffsetData unwrap = EncodedOffsetData.unwrap(smallestBytes);
         ParallelConsumer.Tuple<Long, Set<Long>> decodedIncompletes = unwrap.getDecodedIncompletes(lowWaterMark);
         assertThat(decodedIncompletes.getRight()).containsExactlyInAnyOrderElementsOf(incompletes);
 
-        if (nextExpectedOffset - lowWaterMark > BitsetEncoder.MAX_LENGTH_ENCODABLE)
+        if (currentHighestCompleted - lowWaterMark > BitsetEncoder.MAX_LENGTH_ENCODABLE)
             assertThat(encodingMap.keySet()).as("Gracefully ignores that Bitset can't be supported").doesNotContain(OffsetEncoding.BitSet);
         else
             assertThat(encodingMap.keySet()).contains(OffsetEncoding.BitSet);
@@ -237,7 +264,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsArentSequentialTwo() {
             log.info("Testing {}", encodingToUse);
             byte[] bitsetBytes = encodingMap.get(encodingToUse);
             if (bitsetBytes != null) {
-                EncodedOffsetPair bitsetUnwrap = EncodedOffsetPair.unwrap(encoder.packEncoding(new EncodedOffsetPair(encodingToUse, ByteBuffer.wrap(bitsetBytes))));
+                EncodedOffsetData bitsetUnwrap = EncodedOffsetData.unwrap(encoder.packEncoding(new EncodedOffsetData(encodingToUse, ByteBuffer.wrap(bitsetBytes))));
                 ParallelConsumer.Tuple<Long, Set<Long>> decodedBitsets = bitsetUnwrap.getDecodedIncompletes(lowWaterMark);
                 assertThat(decodedBitsets.getRight())
                         .as(encodingToUse.toString())
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoderTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoderTest.java
new file mode 100644
index 000000000..348d441b8
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/OffsetSimultaneousEncoderTest.java
@@ -0,0 +1,36 @@
+package io.confluent.parallelconsumer;
+
+import lombok.SneakyThrows;
+import lombok.extern.slf4j.Slf4j;
+import org.assertj.core.api.Assertions;
+import org.junit.jupiter.api.Test;
+
+import java.util.HashSet;
+
+@Slf4j
+public class OffsetSimultaneousEncoderTest {
+    @SneakyThrows
+    @Test
+    void general() {
+        long highest = 0L;
+        int base = 0;
+
+        OffsetSimultaneousEncoder o = new OffsetSimultaneousEncoder(base, highest);
+
+        //
+        o.encodeCompleteOffset(base, highest, highest);
+        highest++;
+        o.encodeCompleteOffset(base, highest, highest);
+
+        highest++;
+        o.encodeCompleteOffset(base, highest, highest);
+
+        //
+        HashSet<OffsetEncoderBase> encoders = o.encoders;
+        log.debug(encoders.toString());
+        o.serializeAllEncoders();
+        Object smallestCodec = o.getSmallestCodec();
+        byte[] bytes = o.packSmallest();
+        Assertions.assertThat(encoders);
+    }
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java
index 7b8973876..1d677874c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTestBase.java
@@ -60,8 +60,9 @@ public class ParallelEoSStreamProcessorTestBase {
      * @see ParallelEoSStreamProcessor#workMailBox
      * @see ParallelEoSStreamProcessor#processWorkCompleteMailBox
      */
-    public static final int DEFAULT_COMMIT_INTERVAL_MAX_MS = 100;
+    public static final int DEFAULT_COMMIT_INTERVAL_MAX_MS = 100; //TODO
 
+    protected ConsumerManager<String, String> consumerManager;
     protected LongPollingMockConsumer<String, String> consumerSpy;
     protected MockProducer<String, String> producerSpy;
 
@@ -90,6 +91,7 @@ public class ParallelEoSStreamProcessorTestBase {
      * Time to wait to verify some assertion types
      */
     long verificationWaitDelay;
+    protected TopicPartition topicPartition = new TopicPartition(INPUT_TOPIC, 0);
 
     @BeforeEach
     public void setupAsyncConsumerTestBase() {
@@ -126,8 +128,11 @@ protected void instantiateConsumerProducer() {
         LongPollingMockConsumer<String, String> consumer = new LongPollingMockConsumer<>(OffsetResetStrategy.EARLIEST);
         MockProducer<String, String> producer = new MockProducer<>(true, null, null); // TODO do async testing
 
+        this.consumerManager = new ConsumerManager<>(consumer);
+
         this.producerSpy = spy(producer);
         this.consumerSpy = spy(consumer);
+
         myRecordProcessingAction = mock(ParallelEoSStreamProcessorTest.MyAction.class);
 
         when(consumerSpy.groupMetadata()).thenReturn(DEFAULT_GROUP_METADATA);
@@ -254,8 +259,8 @@ private void waitForLoopCount(int waitForCount) {
     protected void waitForCommitExact(int partition, int offset) {
         log.debug("Waiting for commit offset {} on partition {}", offset, partition);
         var expectedOffset = new OffsetAndMetadata(offset, "");
-        TopicPartition partitionNumber = new TopicPartition(INPUT_TOPIC, partition);
-        var expectedOffsetMap = UniMaps.of(partitionNumber, expectedOffset);
+        TopicPartition specificTP = new TopicPartition(INPUT_TOPIC, partition);
+        var expectedOffsetMap = UniMaps.of(specificTP, expectedOffset);
         verify(producerSpy, timeout(defaultTimeoutMs).times(1)).sendOffsetsToTransaction(argThat(
                 (offsetMap) -> offsetMap.equals(expectedOffsetMap)),
                 any(ConsumerGroupMetadata.class));
@@ -296,7 +301,7 @@ public void assertCommits(List<Integer> offsets, Optional<String> description) {
     /**
      * Flattens the offsets of all partitions into a single sequential list
      */
-    private List<Integer> extractAllPartitionsOffsetsSequentially() {
+    protected List<Integer> extractAllPartitionsOffsetsSequentially() {
         var result = new ArrayList<Integer>();
         // copy the list for safe concurrent access
         List<Map<TopicPartition, OffsetAndMetadata>> history = new ArrayList<>(consumerSpy.getCommitHistoryInt());
@@ -309,6 +314,19 @@ private List<Integer> extractAllPartitionsOffsetsSequentially() {
                 ).collect(Collectors.toList());
     }
 
+    protected List<OffsetAndMetadata> extractAllPartitionsOffsetsAndMetadataSequentially() {
+        var result = new ArrayList<Integer>();
+        // copy the list for safe concurrent access
+        List<Map<TopicPartition, OffsetAndMetadata>> history = new ArrayList<>(consumerSpy.getCommitHistoryInt());
+        return history.stream()
+                .flatMap(commits ->
+                        {
+                            Collection<OffsetAndMetadata> values = new ArrayList<>(commits.values());
+                            return values.stream();
+                        }
+                ).collect(Collectors.toList());
+    }
+
     public void assertCommits(List<Integer> offsets) {
         assertCommits(offsets, Optional.empty());
     }
@@ -350,8 +368,13 @@ protected void awaitLatch(List<CountDownLatch> latches, int latchIndex) {
 
     @SneakyThrows
     protected void awaitLatch(CountDownLatch latch) {
+        awaitLatch(latch, defaultTimeoutSeconds);
+    }
+
+    @SneakyThrows
+    protected void awaitLatch(final CountDownLatch latch, final int seconds) {
         log.trace("Waiting on latch with timeout {}", defaultTimeout);
-        boolean latchReachedZero = latch.await(defaultTimeoutSeconds, SECONDS);
+        boolean latchReachedZero = latch.await(seconds, SECONDS);
         if (latchReachedZero) {
             log.trace("Latch released");
         } else {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/RunLengthEncoderTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/RunLengthEncoderTest.java
new file mode 100644
index 000000000..3501f323b
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/RunLengthEncoderTest.java
@@ -0,0 +1,562 @@
+package io.confluent.parallelconsumer;
+
+import io.confluent.parallelconsumer.RunLengthEncoder.RunLengthEntry;
+import org.junit.jupiter.api.Disabled;
+import org.junit.jupiter.api.Test;
+import pl.tlinkowski.unij.api.UniLists;
+
+import java.util.List;
+
+import static org.assertj.core.api.Assertions.assertThat;
+import static pl.tlinkowski.unij.api.UniLists.*;
+
+class RunLengthEncoderTest {
+
+    /**
+     * Starting with offsets and bit values:
+     * <p>
+     * 0 1   2 3 4 5 6  7 8 9  10  11 12 13  14 15 16 17
+     * <p>
+     * 0 0   1 1 0 1 1  0 0 0  1    0  0  0   1 1  1  1
+     * <p>
+     * The run lengths are: 2,2,1,2,3,1,3,4
+     * <p>
+     * If we were to need to truncate at offset 4 (the new base)
+     * <p>
+     * 4
+     * <p>
+     * The new offsets and bit values are:
+     * <p>
+     * 0  1 2  3 4 5  6
+     * <p>
+     * 0  1 1  0 0 0  1
+     * <p>
+     * Who's run lengths are:
+     * <p>
+     * 1, 2, 3, 1
+     */
+    @Disabled("V1 deprecated and doesn't currently work")
+    @Test
+    void truncateV1() {
+        // v1
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 0L), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, 10);
+
+            assertOffsetsAndRuns(rl,
+                    of(12, 13, 15, 16, 20, 24, 25, 26, 27), // offsets
+                    of(2, 2, 1, 2, 3, 1, 3, 4)); // runs
+
+            rl.truncateRunlengths(12);
+
+            assertOffsetsAndRuns(rl,
+                    of(2, 4), // offsets
+                    of(14, 15, 16, 17)); // runs
+        }
+
+        //v1
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 0L), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, 0);
+
+            rl.truncateRunlengths(4);
+
+            List<Integer> runLengthEncodingIntegers = rl.getRunLengthEncodingIntegers();
+            assertThat(runLengthEncodingIntegers).containsExactly(1, 2, 3, 1, 3, 4);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(5L, 6L, 10L, 14L, 15L, 16L, 17L);
+        }
+
+        // v1
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 0L), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, 0);
+
+            rl.truncateRunlengths(8);
+
+            List<Integer> runLengthEncodingIntegers = rl.getRunLengthEncodingIntegers();
+            assertThat(runLengthEncodingIntegers).containsExactly(2, 1, 3, 4);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(10L, 14L, 15L, 16L, 17L);
+        }
+
+
+        // v1
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 0L), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, 0);
+
+            rl.truncateRunlengths(9);
+
+            List<Integer> runLengthEncodingIntegers = rl.getRunLengthEncodingIntegers();
+            assertThat(runLengthEncodingIntegers).containsExactly(1, 1, 3, 4);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(10L, 14L, 15L, 16L, 17L);
+        }
+    }
+
+    @Test
+    void truncateV2() {
+        {
+            // test case where base != 0
+            int base = 10;
+            RunLengthEncoder rl = new RunLengthEncoder(base, new OffsetSimultaneousEncoder(base, (long) base), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, base);
+
+            assertThat(rl.runLengthOffsetPairs).extracting(RunLengthEntry::getStartOffset).extracting(Long::intValue).containsExactly(10, 12, 14, 15, 17, 20, 21, 24);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(12L, 13L, 15L, 16L, 20L, 24L, 25L, 26L, 27L);
+
+            rl.truncateRunlengthsV2(22);
+
+            assertThat(rl.runLengthOffsetPairs).extracting(RunLengthEntry::getRunLength).containsExactly(2, 4);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(24L, 25L, 26L, 27L);
+        }
+
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 0L), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, 0);
+
+            rl.truncateRunlengthsV2(4);
+
+            assertThat(rl.runLengthOffsetPairs).extracting(RunLengthEntry::getRunLength).containsExactly(1, 2, 3, 1, 3, 4);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(5L, 6L, 10L, 14L, 15L, 16L, 17L);
+        }
+
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 0L), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, 0);
+
+            rl.truncateRunlengthsV2(8);
+
+            assertThat(rl.runLengthOffsetPairs).extracting(RunLengthEntry::getRunLength).containsExactly(2, 1, 3, 4);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(10L, 14L, 15L, 16L, 17L);
+        }
+
+
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 0L), OffsetEncoding.Version.v2);
+
+            encodePattern(rl, 0);
+
+            rl.truncateRunlengthsV2(9);
+
+            assertThat(rl.runLengthOffsetPairs).extracting(RunLengthEntry::getRunLength).containsExactly(1, 1, 3, 4);
+            assertThat(rl.calculateSucceededActualOffsets()).containsExactly(10L, 14L, 15L, 16L, 17L);
+        }
+    }
+
+    private void encodePattern(final RunLengthEncoder rl, long base) {
+        int highest = 17 + (int) base;
+        int relative = 0;
+        {
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeIncompleteOffset(base, relative, highest);
+            relative++;
+
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeCompleteOffset(base, relative, highest);
+            relative++;
+            rl.encodeCompleteOffset(base, relative, highest);
+        }
+    }
+
+    /**
+     * We receive a truncation request where the truncation point is beyond anything our runlengths cover
+     */
+    @Test
+    void v2TruncateOverMax() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeIncompleteOffset(0, 0, 0);
+        rl.encodeCompleteOffset(0, 1, 1);
+
+//        rl.addTail();
+        rl.truncateRunlengthsV2(2);
+
+        assertThat(rl.runLengthOffsetPairs).isEmpty();
+        assertThat(rl.calculateSucceededActualOffsets()).isEmpty();
+    }
+
+    /**
+     * Encoding requests can be out of order
+     */
+    @Test
+    void outOfOrderEncoding() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 10, 10);
+        rl.encodeCompleteOffset(0, 11, 11);
+        rl.encodeCompleteOffset(0, 12, 12);
+        assertOffsetsAndRuns(rl,
+                of(10, 11, 12), // offsets
+                of(10, 3)); // runs
+
+        // middle offset out of order
+        rl.encodeCompleteOffset(0, 6, 12);
+        assertOffsetsAndRuns(rl,
+                of(6, 10, 11, 12), // offsets
+                of(6, 1, 3, 3)); // runs
+
+        // 0 case offset out of order
+        rl.encodeCompleteOffset(0, 1, 12);
+        assertOffsetsAndRuns(rl,
+                of(1, 6, 10, 11, 12), // offsets
+                of(1, 1, 4, 1, 3, 3)); // runs
+
+        rl.truncateRunlengthsV2(2);
+        assertOffsetsAndRuns(rl,
+                of(6, 10, 11, 12), // offsets
+                of(4, 1, 3, 3)); // runs
+
+        rl.truncateRunlengthsV2(8);
+        assertOffsetsAndRuns(rl,
+                of(10, 11, 12), // offsets
+                of(2, 3)); // runs
+    }
+
+    /**
+     * Segmentation of existing entry on out of order arrival
+     * <p>
+     * Scenarios:
+     * <p>
+     * offset range - run length - bit O or X (x=success)
+     * <p>
+     * one:
+     * <p>
+     * 10-20 - 3 O
+     * <p>
+     * 16 -1 O // ignore - impossible?
+     * <p>
+     * two:
+     * <p>
+     * 10-20 - 3 X
+     * <p>
+     * 16 -1 X // ignore?
+     * <p>
+     * three:
+     * <p>
+     * 10-20 - 3 O
+     * <p>
+     * 16 -1 X results in:
+     * <p>
+     * 10-15 - 5 O 16-16 - 1 X 17-20 - 4 O
+     * <p>
+     * Four:
+     * <p>
+     * 10-20 - 3 X
+     * <p>
+     * 16 -1 O // impossible - ignore*
+     */
+    @Test
+    void segmentTestOne() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 10, 10);
+        assertOffsetsAndRuns(rl,
+                of(10), // offsets
+                of(10, 1)); // runs
+
+        // middle offset out of order
+        rl.encodeCompleteOffset(0, 6, 10);
+        assertOffsetsAndRuns(rl,
+                of(6, 10),
+                of(6, 1, 3, 1));
+
+        assertThat(rl.runLengthOffsetPairs).extracting(RunLengthEntry::getStartOffset).extracting(Long::intValue).containsExactly(0, 6, 7, 10);
+        assertThat(rl.runLengthOffsetPairs).extracting(RunLengthEntry::getRunLength).containsExactly(6, 1, 3, 1);
+        assertThat(rl.calculateSucceededActualOffsets()).extracting(Long::intValue).containsExactly(6, 10);
+    }
+
+    @Test
+    void segmentTestTwo() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(10, 20, 20);
+        assertOffsetsAndRuns(rl,
+                of(30), // successful offset
+                of(20, 1) // run lengths
+        );
+
+        // middle
+        rl.encodeCompleteOffset(10, 10, 20);
+        assertOffsetsAndRuns(rl,
+                of(20, 30),
+                of(10, 1, 9, 1));
+
+        // middle offset out of order
+        rl.encodeCompleteOffset(10, 6, 20);
+        assertOffsetsAndRuns(rl,
+                of(16, 20, 30),
+                of(6, 1, 3, 1, 9, 1));
+
+        // up by one, continuous 6 and 7 combine to one run
+        rl.encodeCompleteOffset(10, 7, 20);
+        assertOffsetsAndRuns(rl,
+                of(16, 17, 20, 30),
+                of(6, 2, 2, 1, 9, 1));
+
+        // down by one, continuous so combine
+        rl.encodeCompleteOffset(10, 5, 20);
+        assertOffsetsAndRuns(rl,
+                of(15, 16, 17, 20, 30),
+                of(5, 3, 2, 1, 9, 1));
+
+        // add a big gap maker
+        rl.encodeCompleteOffset(10, 35, 45);
+        assertOffsetsAndRuns(rl,
+                of(15, 16, 17, 20, 30, 45),
+                of(5, 3, 2, 1, 9, 1, 14, 1));
+
+        // off by one higher, continuous so combine
+        rl.encodeCompleteOffset(10, 36, 46);
+        assertOffsetsAndRuns(rl,
+                of(15, 16, 17, 20, 30, 45, 46),
+                of(5, 3, 2, 1, 9, 1, 14, 2));
+
+        // off by one gap
+        rl.encodeCompleteOffset(10, 38, 48);
+        assertOffsetsAndRuns(rl,
+                of(15, 16, 17, 20, 30, 45, 46, 48),
+                of(5, 3, 2, 1, 9, 1, 14, 2, 1, 1));
+    }
+
+    private void assertOffsetsAndRuns(final RunLengthEncoder rl, List<Integer> goodOffsets, List<Integer> runs) {
+        assertThat(rl.runLengthOffsetPairs)
+                .as("run lengths")
+                .extracting(RunLengthEntry::getRunLength)
+                .containsExactlyElementsOf(runs);
+
+        assertThat(rl.calculateSucceededActualOffsets()).as("succeeded Offsets")
+                .extracting(Long::intValue)
+                .containsExactlyElementsOf(goodOffsets);
+
+    }
+
+    /**
+     * Has to combine 3 run lengths into 1, both from above and below
+     */
+    @Test
+    void segmentTestThree() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(10, 20, 20);
+        assertOffsetsAndRuns(rl,
+                of(30),
+                of(20, 1));
+
+        rl.encodeCompleteOffset(10, 14, 20);
+        assertOffsetsAndRuns(rl,
+                of(24, 30),
+                of(14, 1, 5, 1));
+
+        rl.encodeCompleteOffset(10, 16, 20);
+        assertOffsetsAndRuns(rl,
+                of(24, 26, 30),
+                of(14, 1, 1, 1, 3, 1));
+
+        //
+        rl.encodeCompleteOffset(10, 15, 20);
+        assertOffsetsAndRuns(rl,
+                of(24, 25, 26, 30),
+                of(14, 3, 3, 1));
+    }
+
+    /**
+     * Has to combine 2 run lengths into 1
+     */
+    @Test
+    void segmentTestFour() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 5, 5);
+        assertOffsetsAndRuns(rl,
+                of(5),
+                of(5, 1));
+
+        rl.encodeCompleteOffset(0, 6, 6);
+        assertOffsetsAndRuns(rl,
+                of(5, 6),
+                of(5, 2));
+    }
+
+    /**
+     * Has to combine 2 run lengths into 1. Over
+     */
+    @Test
+    void segmentTestFiveOver() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 4, 4);
+        assertOffsetsAndRuns(rl,
+                of(4),
+                of(4, 1));
+
+        //
+        rl.encodeCompleteOffset(0, 5, 5);
+        assertOffsetsAndRuns(rl,
+                of(4, 5),
+                of(4, 2));
+    }
+
+    /**
+     * Has to combine 2 run lengths into 1. Under
+     */
+    @Test
+    void segmentTestFiveUnder() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 4, 4);
+        assertOffsetsAndRuns(rl,
+                of(4),
+                of(4, 1));
+
+        //
+        rl.encodeCompleteOffset(0, 3, 4);
+        assertOffsetsAndRuns(rl,
+                of(3, 4),
+                of(3, 2));
+    }
+
+    /**
+     * Has to combine 2 run lengths into 1. Over
+     */
+    @Test
+    void segmentTestFiveOverMultiple() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 4, 5);
+        assertOffsetsAndRuns(rl,
+                of(4),
+                of(4, 1));
+
+        //
+        rl.encodeCompleteOffset(0, 5, 5);
+        assertOffsetsAndRuns(rl,
+                of(4, 5),
+                of(4, 2));
+
+        rl.encodeCompleteOffset(0, 6, 6);
+        assertOffsetsAndRuns(rl,
+                of(4, 5, 6),
+                of(4, 3));
+
+        rl.encodeCompleteOffset(0, 7, 7);
+        assertOffsetsAndRuns(rl,
+                of(4, 5, 6, 7),
+                of(4, 4));
+    }
+
+    /**
+     * Has to combine both up and down
+     */
+    @Test
+    void segmentTestFixUpAndDownSimpleUpwards() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 4, 4);
+        assertOffsetsAndRuns(rl,
+                of(4),
+                of(4, 1));
+
+        //
+        rl.encodeCompleteOffset(0, 6, 6);
+        assertOffsetsAndRuns(rl,
+                of(4, 6),
+                of(4, 1, 1, 1));
+
+        rl.encodeCompleteOffset(0, 5, 6);
+        assertOffsetsAndRuns(rl,
+                of(4, 5, 6),
+                of(4, 3));
+    }
+
+    /**
+     * Has to combine both up and down
+     */
+    @Test
+    void segmentTestFixUpAndDownSimpleDownwards() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 6, 6);
+        assertOffsetsAndRuns(rl,
+                of(6),
+                of(6, 1));
+
+        //
+        rl.encodeCompleteOffset(0, 4, 6);
+        assertOffsetsAndRuns(rl,
+                of(4, 6),
+                of(4, 1, 1, 1));
+
+        rl.encodeCompleteOffset(0, 5, 6);
+        assertOffsetsAndRuns(rl,
+                of(4, 5, 6),
+                of(4, 3));
+    }
+
+    @Test
+    void segmentTestThick() {
+        RunLengthEncoder rl = new RunLengthEncoder(0, new OffsetSimultaneousEncoder(0, 1L), OffsetEncoding.Version.v2);
+
+        rl.encodeCompleteOffset(0, 6, 6);
+        rl.encodeCompleteOffset(0, 7, 7);
+        rl.encodeCompleteOffset(0, 9, 9);
+        assertOffsetsAndRuns(rl,
+                of(6, 7, 9),
+                of(6, 2, 1, 1));
+
+        //
+        rl.encodeCompleteOffset(0, 4, 9);
+        assertOffsetsAndRuns(rl,
+                of(4, 6, 7, 9),
+                of(4, 1, 1, 2, 1, 1));
+
+        rl.encodeCompleteOffset(0, 3, 9);
+        assertOffsetsAndRuns(rl,
+                of(3, 4, 6, 7, 9),
+                of(3, 2, 1, 2, 1, 1));
+
+        rl.encodeCompleteOffset(0, 5, 9);
+        assertOffsetsAndRuns(rl,
+                of(3, 4, 5, 6, 7, 9),
+                of(3, 5, 1, 1));
+    }
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java
index b141051f4..ce6793d6c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerOffsetMapCodecManagerTest.java
@@ -71,9 +71,10 @@ class WorkManagerOffsetMapCodecManagerTest {
     @BeforeEach
     void setup() {
         MockConsumer<String, String> consumer = new MockConsumer<>(OffsetResetStrategy.EARLIEST);
-        wm = new WorkManager<>(ParallelConsumerOptions.builder().build(), consumer);
-        om = new OffsetMapCodecManager(wm, consumer);
-        wm.partitionOffsetHighWaterMarks.put(tp, partitionHighWaterMark);
+        ConsumerManager<String, String> consumerManager = new ConsumerManager<>(consumer);
+        wm = new WorkManager<>(ParallelConsumerOptions.builder().build(), consumerManager);
+        om = new OffsetMapCodecManager(wm, consumerManager);
+        wm.partitionOffsetHighestSeen.put(tp, partitionHighWaterMark);
     }
 
     @BeforeAll
@@ -103,18 +104,18 @@ private static StringBuffer generateRandomData(int entries) {
         return randomInput;
     }
 
-    @SneakyThrows
-    @Test
-    void serialiseCycle() {
-        String serialised = om.serialiseIncompleteOffsetMapToBase64(finalOffsetForPartition, tp, incomplete);
-        log.info("Size: {}", serialised.length());
-
-        //
-        Set<Long> longs = om.deserialiseIncompleteOffsetMapFromBase64(finalOffsetForPartition, serialised).getIncompleteOffsets();
-
-        //
-        assertThat(longs.toArray()).containsExactly(incomplete.toArray());
-    }
+//    @SneakyThrows
+//    @Test
+//    void serialiseCycle() {
+//        String serialised = om.serialiseIncompleteOffsetMapToBase64(finalOffsetForPartition, tp, incomplete);
+//        log.info("Size: {}", serialised.length());
+//
+//        //
+//        Set<Long> longs = om.deserialiseIncompleteOffsetMapFromBase64(finalOffsetForPartition, serialised).getIncompleteOffsets();
+//
+//        //
+//        assertThat(longs.toArray()).containsExactly(incomplete.toArray());
+//    }
 
     /**
      * Even Java _binary_ serialisation has very large overheads.
@@ -209,13 +210,13 @@ void base64Encoding() {
         assertThat(originalString).isEqualTo(decodedString);
     }
 
-    @SneakyThrows
-    @Test
-    void loadCompressedRunLengthEncoding() {
-        byte[] bytes = om.encodeOffsetsCompressed(finalOffsetForPartition, tp, incomplete);
-        OffsetMapCodecManager.NextOffsetAndIncompletes longs = om.decodeCompressedOffsets(finalOffsetForPartition, bytes);
-        assertThat(longs.getIncompleteOffsets().toArray()).containsExactly(incomplete.toArray());
-    }
+//    @SneakyThrows
+//    @Test
+//    void loadCompressedRunLengthEncoding() {
+//        byte[] bytes = om.encodeOffsetsCompressed(finalOffsetForPartition, tp, incomplete);
+//        OffsetMapCodecManager.NextOffsetAndIncompletes longs = om.decodeCompressedOffsets(finalOffsetForPartition, bytes);
+//        assertThat(longs.getIncompleteOffsets().toArray()).containsExactly(incomplete.toArray());
+//    }
 
     @Test
     void decodeOffsetMap() {
@@ -232,7 +233,7 @@ void decodeOffsetMap() {
 
     @Test
     void binaryArrayConstruction() {
-        wm.raisePartitionHighWaterMark(6L, tp);
+        wm.raisePartitionHighestSeen(6L, tp);
         String s = om.incompletesToBitmapString(1L, tp, incomplete); //2,3
         assertThat(s).isEqualTo("xooxx");
     }
@@ -266,65 +267,65 @@ void compressDecompressSanityZstd() {
         assertThat(decompressedInput).isEqualTo(ByteBuffer.wrap(input));
     }
 
-    @SneakyThrows
-    @Test
-    void largeOffsetMap() {
-        wm.raisePartitionHighWaterMark(200L, tp);
-        byte[] bytes = om.encodeOffsetsCompressed(0L, tp, incomplete);
-        assertThat(bytes.length).as("very small").isLessThan(30);
-    }
-
-    @SneakyThrows
-    @Test
-    void stringVsByteVsBitSetEncoding() {
-        for (var inputString : inputs) {
-            int inputLength = inputString.length();
-
-            Set<Long> longs = om.bitmapStringToIncomplete(finalOffsetForPartition, inputString);
-
-            OffsetSimultaneousEncoder simultaneousEncoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, partitionHighWaterMark, longs).invoke();
-            byte[] byteByte = simultaneousEncoder.getEncodingMap().get(ByteArray);
-            byte[] bitsBytes = simultaneousEncoder.getEncodingMap().get(BitSet);
-
-//            int compressedBytes = om.compressZstd(byteByte).length;
-//            int compressedBits = om.compressZstd(bitsBytes).length;
-
-            byte[] runlengthBytes = simultaneousEncoder.getEncodingMap().get(RunLength);
-//            int rlBytesCompressed = om.compressZstd(runlengthBytes).length;
-
-            log.info("in: {}", inputString);
-//            log.info("length: {} comp bytes: {} comp bits: {}, uncompressed bits: {}, run length {}, run length compressed: {}", inputLength, compressedBytes, compressedBits, bitsBytes.length, runlengthBytes.length, rlBytesCompressed);
-        }
-        return; // breakpoint
-    }
-
-    @SneakyThrows
-    @Test
-    void deserialiseBitset() {
-        var input = "oxxooooooo";
-        long highWater = input.length();
-        wm.raisePartitionHighWaterMark(highWater, tp);
-
-        Set<Long> longs = om.bitmapStringToIncomplete(finalOffsetForPartition, input);
-        OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, highWater, longs);
-        encoder.invoke();
-        byte[] pack = encoder.packSmallest();
-
-        //
-        EncodedOffsetPair encodedOffsetPair = EncodedOffsetPair.unwrap(pack);
-        String deserialisedBitSet = encodedOffsetPair.getDecodedString();
-        assertThat(deserialisedBitSet).isEqualTo(input);
-    }
-
-    @SneakyThrows
-    @Test
-    void compressionCycle() {
-        byte[] serialised = om.encodeOffsetsCompressed(finalOffsetForPartition, tp, incomplete);
-
-        OffsetMapCodecManager.NextOffsetAndIncompletes deserialised = om.decodeCompressedOffsets(finalOffsetForPartition, serialised);
-
-        assertThat(deserialised.getIncompleteOffsets()).isEqualTo(incomplete);
-    }
+//    @SneakyThrows
+//    @Test
+//    void largeOffsetMap() {
+//        wm.raisePartitionHighestSeen(200L, tp);
+//        byte[] bytes = om.encodeOffsetsCompressed(0L, tp, incomplete);
+//        assertThat(bytes).as("very small").hasSizeLessThan(30);
+//    }
+
+//    @SneakyThrows
+//    @Test
+//    void stringVsByteVsBitSetEncoding() {
+//        for (var inputString : inputs) {
+//            int inputLength = inputString.length();
+//
+//            Set<Long> longs = om.bitmapStringToIncomplete(finalOffsetForPartition, inputString);
+//
+//            OffsetSimultaneousEncoder simultaneousEncoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, partitionHighWaterMark, longs).invoke();
+//            byte[] byteByte = simultaneousEncoder.getEncodingMap().get(ByteArray);
+//            byte[] bitsBytes = simultaneousEncoder.getEncodingMap().get(BitSet);
+//
+////            int compressedBytes = om.compressZstd(byteByte).length;
+////            int compressedBits = om.compressZstd(bitsBytes).length;
+//
+//            byte[] runlengthBytes = simultaneousEncoder.getEncodingMap().get(RunLength);
+////            int rlBytesCompressed = om.compressZstd(runlengthBytes).length;
+//
+//            log.info("in: {}", inputString);
+////            log.info("length: {} comp bytes: {} comp bits: {}, uncompressed bits: {}, run length {}, run length compressed: {}", inputLength, compressedBytes, compressedBits, bitsBytes.length, runlengthBytes.length, rlBytesCompressed);
+//        }
+//        return; // breakpoint
+//    }
+
+//    @SneakyThrows
+//    @Test
+//    void deserialiseBitset() {
+//        var input = "oxxooooooo";
+//        long highWater = input.length();
+//        wm.raisePartitionHighestSeen(highWater, tp);
+//
+//        Set<Long> longs = om.bitmapStringToIncomplete(finalOffsetForPartition, input);
+//        OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, highWater);
+//        encoder.runOverIncompletes(longs, finalOffsetForPartition, highWater);
+//        byte[] pack = encoder.packSmallest();
+//
+//        //
+//        EncodedOffsetData encodedOffsetPair = EncodedOffsetData.unwrap(pack);
+//        String deserialisedBitSet = encodedOffsetPair.getDecodedString();
+//        assertThat(deserialisedBitSet).isEqualTo(input);
+//    }
+//
+//    @SneakyThrows
+//    @Test
+//    void compressionCycle() {
+//        byte[] serialised = om.encodeOffsetsCompressed(finalOffsetForPartition, tp, incomplete);
+//
+//        OffsetMapCodecManager.NextOffsetAndIncompletes deserialised = om.decodeCompressedOffsets(finalOffsetForPartition, serialised);
+//
+//        assertThat(deserialised.getIncompleteOffsets()).isEqualTo(incomplete);
+//    }
 
     @Test
     void runLengthEncoding() {
@@ -335,38 +336,38 @@ void runLengthEncoding() {
         assertThat(OffsetRunLength.runLengthDecodeToString(integers)).isEqualTo(stringMap);
     }
 
-    @Test
-    void differentInputs() {
-        for (final String input : inputs) {
-            // override high water mark setup, as the test sets it manually
-            setup();
-            wm.partitionOffsetHighWaterMarks.put(tp, 0L); // hard reset to zero
-            long highWater = input.length();
-            wm.raisePartitionHighWaterMark(highWater, tp);
-
-            //
-            log.debug("Testing round - size: {} input: '{}'", input.length(), input);
-            Set<Long> longs = om.bitmapStringToIncomplete(finalOffsetForPartition, input);
-            OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, highWater, longs);
-            encoder.invoke();
-
-            // test all encodings created
-            for (final EncodedOffsetPair pair : encoder.sortedEncodings) {
-                byte[] result = encoder.packEncoding(pair);
-
-                //
-                OffsetMapCodecManager.NextOffsetAndIncompletes recoveredIncompleteOffsetTuple = om.decodeCompressedOffsets(finalOffsetForPartition, result);
-                Set<Long> recoveredIncompletes = recoveredIncompleteOffsetTuple.getIncompleteOffsets();
-
-                //
-                assertThat(recoveredIncompletes).containsExactlyInAnyOrderElementsOf(longs);
-
-                //
-                String recoveredOffsetBitmapAsString = om.incompletesToBitmapString(finalOffsetForPartition, tp, recoveredIncompletes);
-                assertThat(recoveredOffsetBitmapAsString).isEqualTo(input);
-            }
-        }
-    }
+//    @Test
+//    void differentInputs() {
+//        for (final String input : inputs) {
+//            // override high water mark setup, as the test sets it manually
+//            setup();
+//            wm.partitionOffsetHighestSeen.put(tp, 0L); // hard reset to zero
+//            long highWater = input.length();
+//            wm.raisePartitionHighestSeen(highWater, tp);
+//
+//            //
+//            log.debug("Testing round - size: {} input: '{}'", input.length(), input);
+//            Set<Long> longs = om.bitmapStringToIncomplete(finalOffsetForPartition, input);
+//            OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, highWater, longs);
+//            encoder.runOverIncompletes(longs, finalOffsetForPartition, highWater);
+//
+//            // test all encodings created
+//            for (final EncodedOffsetData pair : encoder.sortedEncodingData) {
+//                byte[] result = encoder.packEncoding(pair);
+//
+//                //
+//                OffsetMapCodecManager.NextOffsetAndIncompletes recoveredIncompleteOffsetTuple = om.decodeCompressedOffsets(finalOffsetForPartition, result);
+//                Set<Long> recoveredIncompletes = recoveredIncompleteOffsetTuple.getIncompleteOffsets();
+//
+//                //
+//                assertThat(recoveredIncompletes).containsExactlyInAnyOrderElementsOf(longs);
+//
+//                //
+//                String recoveredOffsetBitmapAsString = om.incompletesToBitmapString(finalOffsetForPartition, tp, recoveredIncompletes);
+//                assertThat(recoveredOffsetBitmapAsString).isEqualTo(input);
+//            }
+//        }
+//    }
 
     @Disabled
     @Test
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
index 69e7609bc..0474d0e6c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/WorkManagerTest.java
@@ -21,6 +21,7 @@
 import org.junit.jupiter.api.Test;
 import org.junit.jupiter.params.ParameterizedTest;
 import org.junit.jupiter.params.provider.ValueSource;
+import pl.tlinkowski.unij.api.UniLists;
 
 import java.time.Duration;
 import java.time.Instant;
@@ -31,13 +32,14 @@
 import static io.confluent.parallelconsumer.WorkContainer.getRetryDelay;
 import static java.time.Duration.ofSeconds;
 import static org.assertj.core.api.Assertions.assertThat;
+import static org.assertj.core.api.Assertions.fail;
 import static pl.tlinkowski.unij.api.UniLists.of;
 
 /**
  * @see WorkManager
  */
 @Slf4j
-public class WorkManagerTest {
+class WorkManagerTest {
 
     public static final String INPUT_TOPIC = "input";
     public static final String OUTPUT_TOPIC = "output";
@@ -65,12 +67,18 @@ public void setup() {
     private void setupWorkManager(ParallelConsumerOptions build) {
         offset = 0;
 
-        wm = new WorkManager<>(build, new MockConsumer<>(OffsetResetStrategy.EARLIEST));
+        wm = new WorkManager<>(build, new ConsumerManager(new MockConsumer<>(OffsetResetStrategy.EARLIEST)));
         wm.setClock(clock);
         wm.getSuccessfulWorkListeners().add((work) -> {
             log.debug("Heard some successful work: {}", work);
             successfulWork.add(work);
         });
+        int partition = 0;
+        assignPartition(partition);
+    }
+
+    private void assignPartition(final int partition) {
+        wm.onPartitionsAssigned(UniLists.of(new TopicPartition(INPUT_TOPIC, partition)));
     }
 
     /**
@@ -105,7 +113,7 @@ public void testRemovedUnordered() {
         assertThat(works).hasSize(1);
         assertOffsets(works, of(0));
 
-        wm.success(works.get(0));
+        wm.onSuccess(works.get(0));
 
         works = wm.maybeGetWork(max);
         assertThat(works).hasSize(1);
@@ -124,13 +132,13 @@ public void testUnorderedAndDelayed() {
         assertThat(works).hasSize(2);
         assertOffsets(works, of(0, 1));
 
-        wm.success(works.get(0));
-        wm.failed(works.get(1));
+        wm.onSuccess(works.get(0));
+        wm.onFailure(works.get(1));
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of(2));
 
-        wm.success(works.get(0));
+        wm.onSuccess(works.get(0));
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of());
@@ -144,7 +152,7 @@ public void testUnorderedAndDelayed() {
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of(1));
-        wm.success(works.get(0));
+        wm.onSuccess(works.get(0));
 
         assertThat(successfulWork)
                 .extracting(x -> (int) x.getCr().offset())
@@ -175,7 +183,7 @@ public void testOrderedInFlightShouldBlockQueue() {
         works = wm.maybeGetWork(max);
         assertOffsets(works, of()); // should be blocked by in flight
 
-        wm.success(w);
+        wm.onSuccess(w);
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of(1));
@@ -195,7 +203,7 @@ public void testOrderedAndDelayed() {
         var works = wm.maybeGetWork(max);
         assertOffsets(works, of(0));
         var wc = works.get(0);
-        wm.failed(wc);
+        wm.onFailure(wc);
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of());
@@ -206,7 +214,7 @@ public void testOrderedAndDelayed() {
         assertOffsets(works, of(0));
 
         wc = works.get(0);
-        wm.failed(wc);
+        wm.onFailure(wc);
 
         advanceClock(getRetryDelay().minus(ofSeconds(1)));
 
@@ -217,17 +225,17 @@ public void testOrderedAndDelayed() {
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of(0));
-        wm.success(works.get(0));
+        wm.onSuccess(works.get(0));
 
         assertOffsets(successfulWork, of(0));
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of(1));
-        wm.success(works.get(0));
+        wm.onSuccess(works.get(0));
 
         works = wm.maybeGetWork(max);
         assertOffsets(works, of(2));
-        wm.success(works.get(0));
+        wm.onSuccess(works.get(0));
 
         // check all published in the end
         assertOffsets(successfulWork, of(0, 1, 2));
@@ -235,7 +243,7 @@ public void testOrderedAndDelayed() {
 
     @Test
     public void containerDelay() {
-        var wc = new WorkContainer<String, String>(null);
+        var wc = new WorkContainer<String, String>(0, null);
         assertThat(wc.hasDelayPassed(clock)).isTrue(); // when new no delay
         wc.fail(clock);
         assertThat(wc.hasDelayPassed(clock)).isFalse();
@@ -288,8 +296,8 @@ public void insertWrongOrderPreservesOffsetOrdering() {
         assertOffsets(works, of(0, 1, 2, 6));
 
         // fail some
-        wm.failed(works.get(1));
-        wm.failed(works.get(3));
+        wm.onFailure(works.get(1));
+        wm.onFailure(works.get(3));
 
         //
         works = wm.maybeGetWork(max);
@@ -313,19 +321,35 @@ public void maxPerPartition() {
     public void maxPerTopic() {
     }
 
-    @Test
-    public void maxInFlight() {
-        //
-        var opts = ParallelConsumerOptions.builder();
-        setupWorkManager(opts.build());
-
-        //
-        registerSomeWork();
-
-        //
-        assertThat(wm.maybeGetWork()).hasSize(1);
-        assertThat(wm.maybeGetWork()).isEmpty();
-    }
+//    @Test
+//    public void maxInFlight() {
+//        //
+//        var opts = ParallelConsumerOptions.builder();
+////        opts.softMaxNumberMessagesBeyondBaseCommitOffset(1);
+//        setupWorkManager(opts.build());
+//
+//        //
+//        registerSomeWork();
+//
+//        //
+//        assertThat(wm.maybeGetWork()).hasSize(1);
+//        assertThat(wm.maybeGetWork()).isEmpty();
+//    }
+
+//    @Test
+//    void maxConcurrency() {
+//        //
+//        var opts = ParallelConsumerOptions.builder();
+//        opts.maxConcurrency(1);
+//        setupWorkManager(opts.build());
+//
+//        //
+//        registerSomeWork();
+//
+//        //
+//        assertThat(wm.maybeGetWork()).hasSize(1);
+//        assertThat(wm.maybeGetWork()).isEmpty();
+//    }
 
     static class FluentQueue<T> implements Iterable<T> {
         ArrayDeque<T> work = new ArrayDeque<>();
@@ -349,6 +373,84 @@ public int size() {
         }
     }
 
+//    @Test
+//    public void maxConcurrencyVsInFlightAndNoLeaks() {
+//        //
+//        var opts = ParallelConsumerOptions.builder();
+//        opts.ordering(UNORDERED);
+//
+////        opts.softMaxNumberMessagesBeyondBaseCommitOffset(3);
+////        opts.maxMessagesToQueue(2);
+//
+//        setupWorkManager(opts.build());
+//
+//        //
+//        registerSomeWork();
+//        registerSomeWork();
+//        registerSomeWork();
+//
+//        //
+//        assertThat(wm.getTotalWorkWaitingProcessing()).isEqualTo(9);
+//
+//        //
+//        var work = new FluentQueue<WorkContainer<String, String>>();
+//        Assertions.assertThat(work.add(wm.maybeGetWork())).hasSize(2);
+//
+//        //
+//        assertThat(wm.maybeGetWork()).isEmpty();
+//
+//        // succeed
+//        wm.onSuccess(work.poll());
+//
+//        //
+//        Assertions.assertThat(work.add(wm.maybeGetWork())).hasSize(1);
+//
+//        //
+//        wm.onFailure(work.poll());
+//        // bump the clock - we're not testing delayed failure
+//        advanceClockByDelay();
+//
+//        //
+//        Assertions.assertThat(work.add(wm.maybeGetWork())).hasSize(1);
+//
+//        //
+//        wm.onSuccess(work.poll());
+//        wm.onSuccess(work.poll());
+//
+//        //
+//        Assertions.assertThat(work.add(wm.maybeGetWork(100))).hasSize(2);
+//
+//        //
+//        for (var ignore : work) {
+//            wm.onSuccess(work.poll());
+//        }
+//
+//        //
+//        Assertions.assertThat(work.add(wm.maybeGetWork(10))).hasSize(2);
+//
+//        //
+//        assertThat(wm.getRecordsOutForProcessing()).isEqualTo(2);
+//        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(9);
+//        assertThat(wm.getWorkQueuedInShardsCount()).isEqualTo(4);
+//        Assertions.assertThat(successfulWork).hasSize(5);
+//
+//        //
+//        wm.onSuccess(work.poll());
+//        wm.onSuccess(work.poll());
+//
+//        //
+//        Assertions.assertThat(work.add(wm.maybeGetWork(10))).hasSize(2);
+//        wm.onSuccess(work.poll());
+//        wm.onSuccess(work.poll());
+//
+//        //
+//        assertThat(work.size()).isEqualTo(0);
+//        Assertions.assertThat(successfulWork).hasSize(9);
+//        assertThat(wm.getRecordsOutForProcessing()).isEqualTo(0);
+//        assertThat(wm.getWorkQueuedInShardsCount()).isEqualTo(0);
+//        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(9);
+//    }
+
     @Test
     @Disabled
     public void multipleFailures() {
@@ -373,6 +475,7 @@ public void orderedByPartitionsParallel() {
         registerSomeWork();
 
         var partition = 2;
+        assignPartition(2);
         var rec = new ConsumerRecord<>(INPUT_TOPIC, partition, 10, "66", "value");
         var rec2 = new ConsumerRecord<>(INPUT_TOPIC, partition, 6, "66", "value");
         var rec3 = new ConsumerRecord<>(INPUT_TOPIC, partition, 8, "66", "value");
@@ -401,7 +504,7 @@ public void orderedByPartitionsParallel() {
 
     private void successAll(List<WorkContainer<String, String>> works) {
         for (WorkContainer<String, String> work : works) {
-            wm.success(work);
+            wm.onSuccess(work);
         }
     }
 
@@ -415,6 +518,7 @@ public void orderedByKeyParallel() {
         registerSomeWork();
 
         var partition = 2;
+        assignPartition(2);
         var rec = new ConsumerRecord<>(INPUT_TOPIC, partition, 10, "key-a", "value");
         var rec2 = new ConsumerRecord<>(INPUT_TOPIC, partition, 6, "key-a", "value");
         var rec3 = new ConsumerRecord<>(INPUT_TOPIC, partition, 8, "key-b", "value");
@@ -455,22 +559,28 @@ public void orderedByKeyParallel() {
     public void unorderedPartitionsGreedy() {
     }
 
+    /**
+     *
+     * @param quantityOfRecords the number of messages to test with
+     */
     //        @Test
     @ParameterizedTest
-    @ValueSource(ints = {1, 2, 5, 10, 20, 30, 50, 1000})
-    public void highVolumeKeyOrder(int quantity) {
+    @ValueSource(ints = {1, 2, 5, 10, 20, 30, 50, 1_000, 10_000})
+    void highVolumeKeyOrder(int quantityOfRecords) {
+//    public void highVolumeKeyOrder() {
+//        int quantityOfRecords = 20000;
         int uniqueKeys = 100;
 
         ParallelConsumerOptions build = ParallelConsumerOptions.builder().ordering(KEY).build();
         setupWorkManager(build);
 
-        KafkaTestUtils ktu = new KafkaTestUtils(new MockConsumer(OffsetResetStrategy.EARLIEST));
+        KafkaTestUtils ktu = new KafkaTestUtils(new MockConsumer<>(OffsetResetStrategy.EARLIEST));
 
         List<Integer> keys = range(uniqueKeys).list();
 
-        var records = ktu.generateRecords(keys, quantity);
+        var records = ktu.generateRecords(keys, quantityOfRecords);
         var flattened = ktu.flatten(records.values());
-        Collections.sort(flattened, (o1, o2) -> Long.compare(o1.offset(), o2.offset()));
+        flattened.sort(Comparator.comparingLong(ConsumerRecord::offset));
 
         Map<TopicPartition, List<ConsumerRecord<String, String>>> m = new HashMap<>();
         m.put(new TopicPartition(INPUT_TOPIC, 0), flattened);
@@ -480,7 +590,7 @@ public void highVolumeKeyOrder(int quantity) {
         wm.registerWork(recs);
 
         //
-        List<WorkContainer<String, String>> work = wm.maybeGetWork();
+        List<WorkContainer<String, String>> work = wm.maybeGetWork(quantityOfRecords);
 
         //
         assertThat(work).hasSameSizeAs(records.keySet());
@@ -495,7 +605,7 @@ public void treeMapOrderingCorrect() {
 
         var treeMap = new TreeMap<Long, WorkContainer<String, String>>();
         for (ConsumerRecord<String, String> record : records) {
-            treeMap.put(record.offset(), new WorkContainer<>(record));
+            treeMap.put(record.offset(), new WorkContainer<>(0, record));
         }
 
         // read back, assert correct order
@@ -523,17 +633,17 @@ public void workQueuesEmptyWhenAllWorkComplete() {
         //
         for (var w : work) {
             w.onUserFunctionSuccess();
-            wm.success(w);
+            wm.onSuccess(w);
         }
 
         //
         assertThat(wm.getWorkQueuedInShardsCount()).isZero();
-        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(3);
+        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(0);
 
         // drain commit queue
-        var completedFutureOffsets = wm.findCompletedEligibleOffsetsAndRemove();
-        assertThat(completedFutureOffsets).hasSize(1); // coalesces (see log)
-        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(0);
+//        var completedFutureOffsets = wm.findCompletedEligibleOffsetsAndRemove();
+//        assertThat(completedFutureOffsets).hasSize(1); // coalesces (see log)
+//        assertThat(wm.getNumberOfEntriesInPartitionQueues()).isEqualTo(0);
     }
 
 }
diff --git a/parallel-consumer-core/src/test/resources/junit-platform.properties b/parallel-consumer-core/src/test/resources/junit-platform.properties
index 7f40a1ce1..e3c240beb 100644
--- a/parallel-consumer-core/src/test/resources/junit-platform.properties
+++ b/parallel-consumer-core/src/test/resources/junit-platform.properties
@@ -2,4 +2,4 @@
 # Copyright (C) 2020 Confluent, Inc.
 #
 
-junit.jupiter.displayname.generator.default = io.confluent.csid.utils.ReplaceCamelCase
\ No newline at end of file
+#junit.jupiter.displayname.generator.default = io.confluent.csid.utils.ReplaceCamelCase
\ No newline at end of file
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index dc07ac03c..ef75ad81a 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -46,6 +46,8 @@
     <!--    <logger name="io.confluent.parallelconsumer.OffsetMapCodecManager" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer.WorkManagerOffsetMapCodecManagerTest" level="debug"/>-->
 <!--    <logger name="io.confluent.parallelconsumer.OffsetRunLength" level="trace"/>-->
+<!--    <logger name="io.confluent.parallelconsumer.OffsetRunLength" level="trace"/>-->
+        <!-- <logger name="io.confluent.parallelconsumer.BitsetEncoder" level="debug"/> -->
 
     <!-- containers -->
     <!--    <logger name="io.confluent.parallelconsumer.integrationTests.DbTest" level="debug"/>-->
diff --git a/pom.xml b/pom.xml
index 6080e16d1..551bd47e5 100644
--- a/pom.xml
+++ b/pom.xml
@@ -328,7 +328,7 @@
             <dependency>
                 <groupId>org.awaitility</groupId>
                 <artifactId>awaitility</artifactId>
-                <version>4.0.3</version>
+                <version>4.0.4-SNAPSHOT</version>
                 <scope>test</scope>
             </dependency>
             <dependency>

From efbb89942672ece562cd3eeabcc7ecff23539991 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 11 Dec 2020 19:30:12 +0000
Subject: [PATCH 020/131] Spelling

---
 .../main/java/io/confluent/parallelconsumer/WorkManager.java  | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index ef6911928..d608911f6 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -512,7 +512,7 @@ private void prepareContinuousEncoder(final WorkContainer<K, V> wc) {
     }
 
     private void checkHighestSucceededSoFar(final WorkContainer<K, V> wc) {
-        // preivous record must be completed if we've never seen this before
+        // previous record must be completed if we've never seen this before
         partitionOffsetHighestSucceeded.putIfAbsent(wc.getTopicPartition(), wc.offset() - 1);
     }
 
@@ -626,7 +626,7 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
                 // TODO refactor this and the rest of the partition state monitoring code out
                 // check we have capacity in offset storage to process more messages
                 Boolean allowedMoreRecords = partitionMoreRecordsAllowedToProcess.get(topicPartitionKey);
-                // If the record has been previosly attempted, it is already represented in the current offset encoding,
+                // If the record has been previously attempted, it is already represented in the current offset encoding,
                 // and may in fact be the message holding up the partition so must be retried
                 if (!allowedMoreRecords && workContainer.hasPreviouslyFailed()) {
                     OffsetSimultaneousEncoder offsetSimultaneousEncoder = partitionContinuousOffsetEncoders.get(topicPartitionKey);

From cb60705f828561af8834cfb2c6be77a351c0bf05 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 15 Dec 2020 00:08:43 +0000
Subject: [PATCH 021/131] Important todo

---
 .../src/main/java/io/confluent/parallelconsumer/WorkManager.java | 1 +
 1 file changed, 1 insertion(+)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
index d608911f6..9ea5d142c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/WorkManager.java
@@ -620,6 +620,7 @@ public List<WorkContainer<K, V>> maybeGetWork(int requestedMaxWorkToRetrieve) {
                 var topicPartitionKey = workContainer.getTopicPartition();
 
                 {
+                    // todo can't just skip, must remove
                     if (checkEpoch(workContainer)) continue;
                 }
 

From 9abeacb73990ada298d623c8bc983f51d83ed626 Mon Sep 17 00:00:00 2001
From: "dependabot[bot]" <49699333+dependabot[bot]@users.noreply.github.com>
Date: Fri, 20 May 2022 16:33:34 +0000
Subject: [PATCH 022/131] build(deps): bump testcontainers.version from 1.17.1
 to 1.17.2

Bumps `testcontainers.version` from 1.17.1 to 1.17.2.

Updates `testcontainers` from 1.17.1 to 1.17.2
- [Release notes](https://github.com/testcontainers/testcontainers-java/releases)
- [Changelog](https://github.com/testcontainers/testcontainers-java/blob/master/CHANGELOG.md)
- [Commits](https://github.com/testcontainers/testcontainers-java/compare/1.17.1...1.17.2)

Updates `kafka` from 1.17.1 to 1.17.2
- [Release notes](https://github.com/testcontainers/testcontainers-java/releases)
- [Changelog](https://github.com/testcontainers/testcontainers-java/blob/master/CHANGELOG.md)
- [Commits](https://github.com/testcontainers/testcontainers-java/compare/1.17.1...1.17.2)

Updates `junit-jupiter` from 1.17.1 to 1.17.2
- [Release notes](https://github.com/testcontainers/testcontainers-java/releases)
- [Changelog](https://github.com/testcontainers/testcontainers-java/blob/master/CHANGELOG.md)
- [Commits](https://github.com/testcontainers/testcontainers-java/compare/1.17.1...1.17.2)

Updates `postgresql` from 1.17.1 to 1.17.2
- [Release notes](https://github.com/testcontainers/testcontainers-java/releases)
- [Changelog](https://github.com/testcontainers/testcontainers-java/blob/master/CHANGELOG.md)
- [Commits](https://github.com/testcontainers/testcontainers-java/compare/1.17.1...1.17.2)

---
updated-dependencies:
- dependency-name: org.testcontainers:testcontainers
  dependency-type: direct:production
  update-type: version-update:semver-patch
- dependency-name: org.testcontainers:kafka
  dependency-type: direct:production
  update-type: version-update:semver-patch
- dependency-name: org.testcontainers:junit-jupiter
  dependency-type: direct:production
  update-type: version-update:semver-patch
- dependency-name: org.testcontainers:postgresql
  dependency-type: direct:production
  update-type: version-update:semver-patch
...

Signed-off-by: dependabot[bot] <support@github.com>
---
 pom.xml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pom.xml b/pom.xml
index f0ed2a681..9855f0cd3 100644
--- a/pom.xml
+++ b/pom.xml
@@ -108,7 +108,7 @@
         <!-- tests deps-->
         <junit.version>5.8.2</junit.version>
         <junit.platform.version>1.8.2</junit.platform.version>
-        <testcontainers.version>1.17.1</testcontainers.version>
+        <testcontainers.version>1.17.2</testcontainers.version>
         <truth.version>1.1.3</truth.version>
         <flogger.version>0.7.4</flogger.version>
         <mockito.version>4.5.1</mockito.version>

From 29ca397d4f7cd64ea0fc99b12e69e1df867a1109 Mon Sep 17 00:00:00 2001
From: "dependabot[bot]" <49699333+dependabot[bot]@users.noreply.github.com>
Date: Fri, 20 May 2022 16:34:19 +0000
Subject: [PATCH 023/131] build(deps): bump versions-maven-plugin from 2.10.0
 to 2.11.0

Bumps [versions-maven-plugin](https://github.com/mojohaus/versions-maven-plugin) from 2.10.0 to 2.11.0.
- [Release notes](https://github.com/mojohaus/versions-maven-plugin/releases)
- [Changelog](https://github.com/mojohaus/versions-maven-plugin/blob/master/ReleaseNotes.md)
- [Commits](https://github.com/mojohaus/versions-maven-plugin/compare/versions-maven-plugin-2.10.0...versions-maven-plugin-2.11.0)

---
updated-dependencies:
- dependency-name: org.codehaus.mojo:versions-maven-plugin
  dependency-type: direct:production
  update-type: version-update:semver-minor
...

Signed-off-by: dependabot[bot] <support@github.com>
---
 pom.xml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pom.xml b/pom.xml
index f0ed2a681..279dbbb80 100644
--- a/pom.xml
+++ b/pom.xml
@@ -867,7 +867,7 @@
                 <!-- for use in idea -->
                 <groupId>org.codehaus.mojo</groupId>
                 <artifactId>versions-maven-plugin</artifactId>
-                <version>2.10.0</version>
+                <version>2.11.0</version>
             </plugin>
         </plugins>
 

From ec21ad04b803d072c6022a24cf4ab7d792600ae2 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 21 May 2022 12:51:55 +0100
Subject: [PATCH 024/131] START: Try to reproduce issue #184 - run against
 multiple topics

---
 .../integrationTests/MultiTopicTest.java      | 57 +++++++++++++++++++
 1 file changed, 57 insertions(+)
 create mode 100644 parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
new file mode 100644
index 000000000..3008c67d2
--- /dev/null
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -0,0 +1,57 @@
+package io.confluent.parallelconsumer.integrationTests;
+
+import io.confluent.parallelconsumer.ParallelConsumerOptions;
+import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
+import lombok.extern.slf4j.Slf4j;
+import org.apache.kafka.common.TopicPartition;
+import org.hamcrest.Matchers;
+import org.junit.jupiter.api.Test;
+
+import java.util.List;
+import java.util.concurrent.atomic.AtomicInteger;
+
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
+import static org.awaitility.Awaitility.await;
+import static org.hamcrest.Matchers.equalTo;
+
+/**
+ * Originally created to investigate issue report #184
+ */
+@Slf4j
+class MultiTopicTest {
+    @Test
+    void multiTopic() {
+        int numTopics = 3;
+        List<TopicPartition> topics = createTopics(numTopics);
+        int recordsPerTopic = 333;
+        topics.forEach(topic -> sendMessages(topic, recordsPerTopic));
+        ParallelEoSStreamProcessor pc;
+        ParallelConsumerOptions.builder().ordering(KEY);
+        AtomicInteger messageProcessedCount = new AtomicInteger();
+        pc.poll(pollContext -> {
+            log.debug(pollContext.toString());
+            messageProcessedCount.incrementAndGet();
+        });
+
+        // processed
+        int expectedMessagesCount = recordsPerTopic * numTopics;
+        await().untilAtomic(messageProcessedCount, Matchers.is(equalTo(expectedMessagesCount)));
+
+        // commits
+        await().untilAsserted(() -> {
+            topics.forEach(topic -> assertCommit(topic, recordsPerTopic));
+        });
+    }
+
+    private void sendMessages(TopicPartition topic, int recordsPerTopic) {
+
+    }
+
+    private List<TopicPartition> createTopics(int numTopics) {
+
+    }
+
+    private void assertCommit(TopicPartition topic, int recordsPerTopic) {
+
+    }
+}

From 1b9d2adc9d18657d83882be70d357309a9dfa3d1 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 21 May 2022 13:32:56 +0100
Subject: [PATCH 025/131] test compiles

---
 parallel-consumer-core/pom.xml                |  2 +
 .../BrokerIntegrationTest.java                |  2 +
 .../MultiInstanceHighVolumeTest.java          | 80 ++++-------------
 .../integrationTests/MultiTopicTest.java      | 30 ++++---
 .../utils/KafkaClientUtils.java               | 85 ++++++++++++++++++-
 .../truth/KafkaConsumerSubject.java           | 46 ++++++++++
 6 files changed, 167 insertions(+), 78 deletions(-)
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java

diff --git a/parallel-consumer-core/pom.xml b/parallel-consumer-core/pom.xml
index fd4e74886..b5671010a 100644
--- a/parallel-consumer-core/pom.xml
+++ b/parallel-consumer-core/pom.xml
@@ -137,8 +137,10 @@
                         <class>org.apache.kafka.clients.consumer.OffsetAndMetadata</class>
                         <class>org.apache.kafka.clients.consumer.ConsumerRecord</class>
                         <class>org.apache.kafka.clients.consumer.ConsumerRecords</class>
+                        <class>org.apache.kafka.clients.consumer.KafkaConsumer</class>
                         <class>org.apache.kafka.clients.producer.RecordMetadata</class>
                         <class>org.apache.kafka.clients.producer.ProducerRecord</class>
+                        <class>org.apache.kafka.clients.producer.KafkaProducer</class>
                     </legacyClasses>
                     <entryPointClassPackage>io.confluent.parallelconsumer</entryPointClassPackage>
                 </configuration>
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
index eee2e695f..3bb6ea52f 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
@@ -9,6 +9,7 @@
 
 import io.confluent.csid.testcontainers.FilteredTestContainerSlf4jLogConsumer;
 import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils;
+import lombok.Getter;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.CreateTopicsResult;
 import org.apache.kafka.clients.admin.NewTopic;
@@ -53,6 +54,7 @@ public abstract class BrokerIntegrationTest<K, V> {
         kafkaContainer.start();
     }
 
+    @Getter
     protected KafkaClientUtils kcu = new KafkaClientUtils(kafkaContainer);
 
     @BeforeAll
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java
index 035541042..849c8c714 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java
@@ -7,24 +7,22 @@
 import io.confluent.csid.utils.ProgressBarUtils;
 import io.confluent.csid.utils.StringUtils;
 import io.confluent.csid.utils.TrimListRepresentation;
-import io.confluent.parallelconsumer.ParallelConsumerOptions;
+import io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode;
+import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import me.tongfei.progressbar.ProgressBar;
-import org.apache.kafka.clients.consumer.ConsumerConfig;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
-import org.apache.kafka.clients.consumer.KafkaConsumer;
-import org.apache.kafka.clients.producer.Producer;
-import org.apache.kafka.clients.producer.ProducerRecord;
-import org.apache.kafka.clients.producer.RecordMetadata;
 import org.assertj.core.api.Assertions;
 import org.assertj.core.api.SoftAssertions;
 import org.awaitility.core.ConditionTimeoutException;
 import org.junit.jupiter.api.Test;
 
-import java.util.*;
-import java.util.concurrent.Future;
+import java.util.ArrayList;
+import java.util.Collections;
+import java.util.List;
+import java.util.Optional;
 import java.util.concurrent.atomic.AtomicInteger;
 
 import static java.time.Duration.ofSeconds;
@@ -45,8 +43,8 @@ class MultiInstanceHighVolumeTest extends BrokerIntegrationTest<String, String>
 
     int maxPoll = 500; // 500 is the kafka default
 
-    ParallelConsumerOptions.CommitMode commitMode = ParallelConsumerOptions.CommitMode.PERIODIC_CONSUMER_SYNC;
-    ParallelConsumerOptions.ProcessingOrder order = ParallelConsumerOptions.ProcessingOrder.KEY;
+    CommitMode commitMode = CommitMode.PERIODIC_CONSUMER_SYNC;
+    ProcessingOrder order = ProcessingOrder.KEY;
 
 
     // todo multi commit mode, multi partition count, multi instance count? 2,3,10,100? more instances than partitions, more partitions than instances
@@ -64,9 +62,9 @@ void multiInstance() {
         produceMessages(inputTopicName, expectedKeys, expectedMessageCount);
 
         // setup
-        ParallelEoSStreamProcessor<String, String> pcOne = buildPc(inputTopicName, expectedMessageCount);
-        ParallelEoSStreamProcessor<String, String> pcTwo = buildPc(inputTopicName, expectedMessageCount);
-        ParallelEoSStreamProcessor<String, String> pcThree = buildPc(inputTopicName, expectedMessageCount);
+        ParallelEoSStreamProcessor<String, String> pcOne = buildPc(inputTopicName, expectedMessageCount, maxPoll, order, commitMode);
+        ParallelEoSStreamProcessor<String, String> pcTwo = buildPc(inputTopicName, expectedMessageCount, maxPoll, order, commitMode);
+        ParallelEoSStreamProcessor<String, String> pcThree = buildPc(inputTopicName, expectedMessageCount, maxPoll, order, commitMode);
 
         // run
         var consumedByOne = Collections.synchronizedList(new ArrayList<ConsumerRecord<?, ?>>());
@@ -110,6 +108,12 @@ void multiInstance() {
         bars.forEach(ProgressBar::close);
     }
 
+    private ParallelEoSStreamProcessor<String, String> buildPc(String inputTopicName, int maxPoll, ProcessingOrder order, CommitMode commitMode) {
+        var pc = getKcu().buildPc(order, commitMode, maxPoll);
+        pc.subscribe(of(inputTopicName));
+        return pc;
+    }
+
     Integer barId = 0;
 
     private ProgressBar run(final int expectedMessageCount, final ParallelEoSStreamProcessor<String, String> pc, List<ConsumerRecord<?, ?>> consumed) {
@@ -147,54 +151,4 @@ private void processRecord(final ProgressBar bar,
 //        return new ProducerRecord<>(outputName, record.key(), "data");
     }
 
-    private ParallelEoSStreamProcessor<String, String> buildPc(final String inputName,
-                                                               final int expectedMessageCount) {
-        log.debug("Starting test");
-//        KafkaProducer<String, String> newProducer = kcu.createNewProducer(commitMode.equals(PERIODIC_TRANSACTIONAL_PRODUCER));
-
-        Properties consumerProps = new Properties();
-        consumerProps.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, maxPoll);
-        KafkaConsumer<String, String> newConsumer = kcu.createNewConsumer(false, consumerProps);
-
-        var pc = new ParallelEoSStreamProcessor<String, String>(ParallelConsumerOptions.<String, String>builder()
-                .ordering(order)
-                .consumer(newConsumer)
-                .commitMode(commitMode)
-                .maxConcurrency(100)
-                .build());
-        pc.subscribe(of(inputName));
-        pc.setTimeBetweenCommits(ofSeconds(1));
-
-        // sanity
-        return pc;
-    }
-
-    private void produceMessages(final String inputName, final List<String> expectedKeys,
-                                 final int expectedMessageCount) throws InterruptedException, java.util.concurrent.ExecutionException {
-        log.info("Producing {} messages to {}", expectedMessageCount, inputName);
-        List<Future<RecordMetadata>> sends = new ArrayList<>();
-        try (Producer<String, String> kafkaProducer = kcu.createNewProducer(false)) {
-            for (int i = 0; i < expectedMessageCount; i++) {
-                String key = "key-" + i;
-                Future<RecordMetadata> send = kafkaProducer.send(new ProducerRecord<>(inputName, key, "value-" + i), (meta, exception) -> {
-                    if (exception != null) {
-                        log.error("Error sending, ", exception);
-                    }
-                });
-                sends.add(send);
-                expectedKeys.add(key);
-            }
-            log.debug("Finished sending test data");
-        }
-        // make sure we finish sending before next stage
-        log.debug("Waiting for broker acks");
-        for (Future<RecordMetadata> send : sends) {
-            RecordMetadata recordMetadata = send.get();
-            boolean b = recordMetadata.hasOffset();
-            assertThat(b).isTrue();
-            long offset = recordMetadata.offset();
-        }
-        assertThat(sends).hasSize(expectedMessageCount);
-    }
-
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index 3008c67d2..fd93f1fb7 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -1,9 +1,9 @@
 package io.confluent.parallelconsumer.integrationTests;
 
-import io.confluent.parallelconsumer.ParallelConsumerOptions;
-import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
+import io.confluent.parallelconsumer.ManagedTruth;
+import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
-import org.apache.kafka.common.TopicPartition;
+import org.apache.kafka.clients.admin.NewTopic;
 import org.hamcrest.Matchers;
 import org.junit.jupiter.api.Test;
 
@@ -18,16 +18,19 @@
  * Originally created to investigate issue report #184
  */
 @Slf4j
-class MultiTopicTest {
+class MultiTopicTest extends BrokerIntegrationTest<String, String> {
+
     @Test
     void multiTopic() {
         int numTopics = 3;
-        List<TopicPartition> topics = createTopics(numTopics);
+        List<NewTopic> topics = getKcu().createTopics(numTopics);
         int recordsPerTopic = 333;
         topics.forEach(topic -> sendMessages(topic, recordsPerTopic));
-        ParallelEoSStreamProcessor pc;
-        ParallelConsumerOptions.builder().ordering(KEY);
+
+        var pc = getKcu().buildPc(KEY);
+
         AtomicInteger messageProcessedCount = new AtomicInteger();
+
         pc.poll(pollContext -> {
             log.debug(pollContext.toString());
             messageProcessedCount.incrementAndGet();
@@ -43,15 +46,16 @@ void multiTopic() {
         });
     }
 
-    private void sendMessages(TopicPartition topic, int recordsPerTopic) {
 
+    @SneakyThrows
+    private void sendMessages(NewTopic topic, int recordsPerTopic) {
+        getKcu().produceMessages(topic.name(), recordsPerTopic);
     }
 
-    private List<TopicPartition> createTopics(int numTopics) {
-
+    private void assertCommit(NewTopic topic, int recordsPerTopic) {
+        ManagedTruth.assertThat(getKcu().getLastConsumerConstructed())
+                .hasCommittedToPartition(topic)
+                .offset(recordsPerTopic);
     }
 
-    private void assertCommit(TopicPartition topic, int recordsPerTopic) {
-
-    }
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index 403ee169c..0c94fa52a 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -3,24 +3,37 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import io.confluent.parallelconsumer.ParallelConsumerOptions;
+import io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode;
+import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
+import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import lombok.Getter;
+import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
+import one.util.streamex.IntStreamEx;
 import org.apache.commons.lang3.RandomUtils;
 import org.apache.kafka.clients.admin.AdminClient;
+import org.apache.kafka.clients.admin.NewTopic;
 import org.apache.kafka.clients.consumer.ConsumerConfig;
 import org.apache.kafka.clients.consumer.KafkaConsumer;
 import org.apache.kafka.clients.consumer.OffsetResetStrategy;
-import org.apache.kafka.clients.producer.KafkaProducer;
-import org.apache.kafka.clients.producer.ProducerConfig;
+import org.apache.kafka.clients.producer.*;
 import org.apache.kafka.common.serialization.StringDeserializer;
 import org.apache.kafka.common.serialization.StringSerializer;
 import org.junit.jupiter.api.AfterEach;
 import org.junit.jupiter.api.BeforeEach;
 import org.testcontainers.containers.KafkaContainer;
 
+import java.util.ArrayList;
+import java.util.List;
 import java.util.Properties;
+import java.util.concurrent.ExecutionException;
+import java.util.concurrent.Future;
 
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.PERIODIC_CONSUMER_ASYNCHRONOUS;
 import static java.time.Duration.ofSeconds;
+import static java.util.Optional.empty;
+import static org.assertj.core.api.Assertions.assertThat;
 
 @Slf4j
 public class KafkaClientUtils {
@@ -40,6 +53,11 @@ public class KafkaClientUtils {
     private AdminClient admin;
     private final String groupId = GROUP_ID_PREFIX + RandomUtils.nextInt();
 
+    /**
+     * todo docs
+     */
+    private KafkaConsumer<String, String> lastConsumerConstructed;
+
 
     public KafkaClientUtils(KafkaContainer kafkaContainer) {
         kafkaContainer.addEnv("KAFKA_transaction_state_log_replication_factor", "1");
@@ -151,4 +169,67 @@ public <K, V> KafkaProducer<K, V> createNewProducer(boolean tx) {
         log.debug("New producer {}", kvKafkaProducer);
         return kvKafkaProducer;
     }
+
+    @SneakyThrows
+    public List<NewTopic> createTopics(int numTopics) {
+        List<NewTopic> newTopics = IntStreamEx.range(numTopics).mapToObj(i -> new NewTopic("in-" + i, empty(), empty())).toList();
+        getAdmin().createTopics(newTopics).all().get();
+        return newTopics;
+    }
+
+    public List<String> produceMessages(String inputName, int numberToSend) throws InterruptedException, ExecutionException {
+        log.info("Producing {} messages to {}", numberToSend, inputName);
+        final List<String> expectedKeys = new ArrayList<>();
+        List<Future<RecordMetadata>> sends = new ArrayList<>();
+        try (Producer<String, String> kafkaProducer = createNewProducer(false)) {
+            for (int i = 0; i < numberToSend; i++) {
+                String key = "key-" + i;
+                Future<RecordMetadata> send = kafkaProducer.send(new ProducerRecord<>(inputName, key, "value-" + i), (meta, exception) -> {
+                    if (exception != null) {
+                        log.error("Error sending, ", exception);
+                    }
+                });
+                sends.add(send);
+                expectedKeys.add(key);
+            }
+            log.debug("Finished sending test data");
+        }
+        // make sure we finish sending before next stage
+        log.debug("Waiting for broker acks");
+        for (Future<RecordMetadata> send : sends) {
+            RecordMetadata recordMetadata = send.get();
+            boolean b = recordMetadata.hasOffset();
+            assertThat(b).isTrue();
+            long offset = recordMetadata.offset();
+        }
+        assertThat(sends).hasSize(numberToSend);
+        return expectedKeys;
+    }
+
+    public ParallelEoSStreamProcessor<String, String> buildPc(ProcessingOrder order, CommitMode commitMode, int maxPoll) {
+        Properties consumerProps = new Properties();
+        consumerProps.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, maxPoll);
+        KafkaConsumer<String, String> newConsumer = createNewConsumer(false, consumerProps);
+        lastConsumerConstructed = newConsumer;
+
+        var pc = new ParallelEoSStreamProcessor<>(ParallelConsumerOptions.<String, String>builder()
+                .ordering(order)
+                .consumer(newConsumer)
+                .commitMode(commitMode)
+                .maxConcurrency(100)
+                .build());
+
+        pc.setTimeBetweenCommits(ofSeconds(1));
+
+        // sanity
+        return pc;
+    }
+
+    public ParallelEoSStreamProcessor<String, String> buildPc(ProcessingOrder key) {
+        return buildPc(key, PERIODIC_CONSUMER_ASYNCHRONOUS, 500);
+    }
+
+    public KafkaConsumer<String, String> getLastConsumerConstructed() {
+        return lastConsumerConstructed;
+    }
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java
new file mode 100644
index 000000000..8c4c2dfed
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java
@@ -0,0 +1,46 @@
+package io.confluent.parallelconsumer.truth;
+
+import com.google.common.truth.FailureMetadata;
+import io.confluent.parallelconsumer.model.CommitHistory;
+import io.stubbs.truth.generator.SubjectFactoryMethod;
+import io.stubbs.truth.generator.UserManagedTruth;
+import org.apache.kafka.clients.admin.NewTopic;
+import org.apache.kafka.clients.consumer.KafkaConsumer;
+import org.apache.kafka.clients.consumer.KafkaConsumerParentSubject;
+import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import pl.tlinkowski.unij.api.UniSets;
+
+import java.time.Duration;
+import java.util.List;
+
+import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
+
+/**
+ * @see KafkaConsumer
+ * @see KafkaConsumerParentSubject
+ */
+@UserManagedTruth(KafkaConsumer.class)
+public class KafkaConsumerSubject extends KafkaConsumerParentSubject {
+
+    private final Duration timeout = Duration.ofSeconds(10);
+
+    protected KafkaConsumerSubject(FailureMetadata failureMetadata,
+                                   org.apache.kafka.clients.consumer.KafkaConsumer actual) {
+        super(failureMetadata, actual);
+    }
+
+    /**
+     * Returns an assertion builder for a {@link KafkaConsumer} class.
+     */
+    @SubjectFactoryMethod
+    public static Factory<KafkaConsumerSubject, KafkaConsumer> kafkaConsumers() {
+        return KafkaConsumerSubject::new;
+    }
+
+    public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
+        var committed = actual.committed(UniSets.of(topic), timeout);
+        List<OffsetAndMetadata> offsets = committed.get(topic);
+        CommitHistory commitHistory = new CommitHistory(offsets);
+        return check("getCommitHistory(%s)", topic).about(commitHistories()).that(commitHistory);
+    }
+}

From 51ef075829a3eb8b66793f6d16bc975a68227df1 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sun, 22 May 2022 22:35:24 +0100
Subject: [PATCH 026/131] failling test

---
 parallel-consumer-core/pom.xml                |  4 +-
 .../MultiInstanceHighVolumeTest.java          |  9 ++--
 .../integrationTests/MultiTopicTest.java      | 33 +++++++------
 .../utils/KafkaClientUtils.java               |  3 +-
 .../truth/KafkaConsumerSubject.java           | 46 -------------------
 5 files changed, 27 insertions(+), 68 deletions(-)
 delete mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java

diff --git a/parallel-consumer-core/pom.xml b/parallel-consumer-core/pom.xml
index b5671010a..de8bbda5f 100644
--- a/parallel-consumer-core/pom.xml
+++ b/parallel-consumer-core/pom.xml
@@ -137,10 +137,10 @@
                         <class>org.apache.kafka.clients.consumer.OffsetAndMetadata</class>
                         <class>org.apache.kafka.clients.consumer.ConsumerRecord</class>
                         <class>org.apache.kafka.clients.consumer.ConsumerRecords</class>
-                        <class>org.apache.kafka.clients.consumer.KafkaConsumer</class>
+                        <class>org.apache.kafka.clients.consumer.Consumer</class>
                         <class>org.apache.kafka.clients.producer.RecordMetadata</class>
                         <class>org.apache.kafka.clients.producer.ProducerRecord</class>
-                        <class>org.apache.kafka.clients.producer.KafkaProducer</class>
+                        <class>org.apache.kafka.clients.producer.Producer</class>
                     </legacyClasses>
                     <entryPointClassPackage>io.confluent.parallelconsumer</entryPointClassPackage>
                 </configuration>
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java
index 849c8c714..56efc1e4f 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiInstanceHighVolumeTest.java
@@ -54,17 +54,16 @@ void multiInstance() {
         numPartitions = 12;
         String inputTopicName = setupTopic(this.getClass().getSimpleName() + "-input");
 
-        List<String> expectedKeys = new ArrayList<>();
 //        int expectedMessageCount = 10_000_000;
         int expectedMessageCount = 30_000_00;
         log.info("Producing {} messages before starting test", expectedMessageCount);
 
-        produceMessages(inputTopicName, expectedKeys, expectedMessageCount);
+        List<String> expectedKeys = getKcu().produceMessages(inputTopicName, expectedMessageCount);
 
         // setup
-        ParallelEoSStreamProcessor<String, String> pcOne = buildPc(inputTopicName, expectedMessageCount, maxPoll, order, commitMode);
-        ParallelEoSStreamProcessor<String, String> pcTwo = buildPc(inputTopicName, expectedMessageCount, maxPoll, order, commitMode);
-        ParallelEoSStreamProcessor<String, String> pcThree = buildPc(inputTopicName, expectedMessageCount, maxPoll, order, commitMode);
+        ParallelEoSStreamProcessor<String, String> pcOne = buildPc(inputTopicName, maxPoll, order, commitMode);
+        ParallelEoSStreamProcessor<String, String> pcTwo = buildPc(inputTopicName, maxPoll, order, commitMode);
+        ParallelEoSStreamProcessor<String, String> pcThree = buildPc(inputTopicName, maxPoll, order, commitMode);
 
         // run
         var consumedByOne = Collections.synchronizedList(new ArrayList<ConsumerRecord<?, ?>>());
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index fd93f1fb7..dca3cfc17 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -1,16 +1,18 @@
 package io.confluent.parallelconsumer.integrationTests;
 
 import io.confluent.parallelconsumer.ManagedTruth;
+import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.NewTopic;
 import org.hamcrest.Matchers;
-import org.junit.jupiter.api.Test;
+import org.junit.jupiter.params.ParameterizedTest;
+import org.junit.jupiter.params.provider.EnumSource;
 
 import java.util.List;
 import java.util.concurrent.atomic.AtomicInteger;
 
-import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
+import static one.util.streamex.StreamEx.of;
 import static org.awaitility.Awaitility.await;
 import static org.hamcrest.Matchers.equalTo;
 
@@ -20,14 +22,17 @@
 @Slf4j
 class MultiTopicTest extends BrokerIntegrationTest<String, String> {
 
-    @Test
-    void multiTopic() {
+
+    @ParameterizedTest
+    @EnumSource(ParallelConsumerOptions.ProcessingOrder.class)
+    void multiTopic(ParallelConsumerOptions.ProcessingOrder order) {
         int numTopics = 3;
-        List<NewTopic> topics = getKcu().createTopics(numTopics);
+        List<NewTopic> multiTopics = getKcu().createTopics(numTopics);
         int recordsPerTopic = 333;
-        topics.forEach(topic -> sendMessages(topic, recordsPerTopic));
+        multiTopics.forEach(singleTopic -> sendMessages(singleTopic, recordsPerTopic));
 
-        var pc = getKcu().buildPc(KEY);
+        var pc = getKcu().buildPc(order);
+        pc.subscribe(of(multiTopics).map(NewTopic::name).toList());
 
         AtomicInteger messageProcessedCount = new AtomicInteger();
 
@@ -41,20 +46,20 @@ void multiTopic() {
         await().untilAtomic(messageProcessedCount, Matchers.is(equalTo(expectedMessagesCount)));
 
         // commits
-        await().untilAsserted(() -> {
-            topics.forEach(topic -> assertCommit(topic, recordsPerTopic));
-        });
+//        await().untilAsserted(() -> {
+//            multiTopics.forEach(singleTopic -> assertCommit(singleTopic, recordsPerTopic));
+//        });
     }
 
 
     @SneakyThrows
-    private void sendMessages(NewTopic topic, int recordsPerTopic) {
-        getKcu().produceMessages(topic.name(), recordsPerTopic);
+    private void sendMessages(NewTopic newTopic, int recordsPerTopic) {
+        getKcu().produceMessages(newTopic.name(), recordsPerTopic);
     }
 
-    private void assertCommit(NewTopic topic, int recordsPerTopic) {
+    private void assertCommit(NewTopic newTopic, int recordsPerTopic) {
         ManagedTruth.assertThat(getKcu().getLastConsumerConstructed())
-                .hasCommittedToPartition(topic)
+                .hasCommittedToPartition(newTopic)
                 .offset(recordsPerTopic);
     }
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index 0c94fa52a..d1635dfed 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -33,6 +33,7 @@
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.PERIODIC_CONSUMER_ASYNCHRONOUS;
 import static java.time.Duration.ofSeconds;
 import static java.util.Optional.empty;
+import static org.apache.commons.lang3.RandomUtils.nextInt;
 import static org.assertj.core.api.Assertions.assertThat;
 
 @Slf4j
@@ -172,7 +173,7 @@ public <K, V> KafkaProducer<K, V> createNewProducer(boolean tx) {
 
     @SneakyThrows
     public List<NewTopic> createTopics(int numTopics) {
-        List<NewTopic> newTopics = IntStreamEx.range(numTopics).mapToObj(i -> new NewTopic("in-" + i, empty(), empty())).toList();
+        List<NewTopic> newTopics = IntStreamEx.range(numTopics).mapToObj(i -> new NewTopic("in-" + i + "-" + nextInt(), empty(), empty())).toList();
         getAdmin().createTopics(newTopics).all().get();
         return newTopics;
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java
deleted file mode 100644
index 8c4c2dfed..000000000
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/KafkaConsumerSubject.java
+++ /dev/null
@@ -1,46 +0,0 @@
-package io.confluent.parallelconsumer.truth;
-
-import com.google.common.truth.FailureMetadata;
-import io.confluent.parallelconsumer.model.CommitHistory;
-import io.stubbs.truth.generator.SubjectFactoryMethod;
-import io.stubbs.truth.generator.UserManagedTruth;
-import org.apache.kafka.clients.admin.NewTopic;
-import org.apache.kafka.clients.consumer.KafkaConsumer;
-import org.apache.kafka.clients.consumer.KafkaConsumerParentSubject;
-import org.apache.kafka.clients.consumer.OffsetAndMetadata;
-import pl.tlinkowski.unij.api.UniSets;
-
-import java.time.Duration;
-import java.util.List;
-
-import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
-
-/**
- * @see KafkaConsumer
- * @see KafkaConsumerParentSubject
- */
-@UserManagedTruth(KafkaConsumer.class)
-public class KafkaConsumerSubject extends KafkaConsumerParentSubject {
-
-    private final Duration timeout = Duration.ofSeconds(10);
-
-    protected KafkaConsumerSubject(FailureMetadata failureMetadata,
-                                   org.apache.kafka.clients.consumer.KafkaConsumer actual) {
-        super(failureMetadata, actual);
-    }
-
-    /**
-     * Returns an assertion builder for a {@link KafkaConsumer} class.
-     */
-    @SubjectFactoryMethod
-    public static Factory<KafkaConsumerSubject, KafkaConsumer> kafkaConsumers() {
-        return KafkaConsumerSubject::new;
-    }
-
-    public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
-        var committed = actual.committed(UniSets.of(topic), timeout);
-        List<OffsetAndMetadata> offsets = committed.get(topic);
-        CommitHistory commitHistory = new CommitHistory(offsets);
-        return check("getCommitHistory(%s)", topic).about(commitHistories()).that(commitHistory);
-    }
-}

From 7e32d4de0cabdd948b9c15432845cb6eb0d5de73 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sun, 22 May 2022 23:38:29 +0100
Subject: [PATCH 027/131] fixes test - introduce ShardKey

---
 parallel-consumer-core/pom.xml                |  1 +
 .../parallelconsumer/state/ShardKey.java      | 63 +++++++++++++++++++
 .../parallelconsumer/state/ShardManager.java  | 35 ++++-------
 .../integrationTests/MultiTopicTest.java      | 43 +++++++++++--
 .../truth/ConsumerSubject.java                | 57 +++++++++++++++++
 5 files changed, 171 insertions(+), 28 deletions(-)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java

diff --git a/parallel-consumer-core/pom.xml b/parallel-consumer-core/pom.xml
index de8bbda5f..65bfac65d 100644
--- a/parallel-consumer-core/pom.xml
+++ b/parallel-consumer-core/pom.xml
@@ -130,6 +130,7 @@
                         <class>io.confluent.parallelconsumer.state.WorkManager</class>
                         <class>io.confluent.parallelconsumer.state.PartitionState</class>
                         <class>io.confluent.parallelconsumer.state.ProcessingShard</class>
+                        <class>io.confluent.parallelconsumer.state.ShardKey</class>
                         <class>io.confluent.parallelconsumer.offsets.OffsetEncoding</class>
                     </classes>
                     <legacyClasses>
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
new file mode 100644
index 000000000..f58b98ed0
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
@@ -0,0 +1,63 @@
+package io.confluent.parallelconsumer.state;
+
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
+import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
+import lombok.*;
+import lombok.experimental.FieldDefaults;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.common.TopicPartition;
+
+/**
+ * todo docs
+ */
+@Getter
+@FieldDefaults(makeFinal = true, level = AccessLevel.PRIVATE)
+@ToString
+@EqualsAndHashCode
+public class ShardKey {
+
+    public static ShardKey of(WorkContainer<?, ?> wc, ProcessingOrder ordering) {
+        return of(wc.getCr(), ordering);
+    }
+
+    public static ShardKey of(ConsumerRecord<?, ?> rec, ProcessingOrder ordering) {
+        return switch (ordering) {
+            case KEY -> ofKey(rec);
+            case PARTITION, UNORDERED -> ofTopicPartition(rec);
+        };
+    }
+
+    public static KeyOrderedKey ofKey(ConsumerRecord<?, ?> rec) {
+        return new KeyOrderedKey(rec);
+    }
+
+    public static ShardKey ofTopicPartition(final ConsumerRecord<?, ?> rec) {
+        return new TopicPartitionKey(new TopicPartition(rec.topic(), rec.partition()));
+    }
+
+    @Value
+    @RequiredArgsConstructor
+    @EqualsAndHashCode(callSuper = true)
+    public static class KeyOrderedKey extends ShardKey {
+        /**
+         * Note: We use just the topic name here, and not the partition, so that if we were to receive records from the
+         * same key from the partitions we're assigned, they will be put into the same queue.
+         */
+        String topicName;
+        Object key;
+
+        public KeyOrderedKey(final ConsumerRecord<?, ?> rec) {
+            this(rec.topic(), rec.key());
+        }
+    }
+
+    @Value
+    @EqualsAndHashCode(callSuper = true)
+    public static class TopicPartitionKey extends ShardKey {
+        TopicPartition topicPartition;
+    }
+
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
index 215494c6e..dbf497fce 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
@@ -12,7 +12,6 @@
 import lombok.Getter;
 import lombok.RequiredArgsConstructor;
 import lombok.extern.slf4j.Slf4j;
-import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.common.TopicPartition;
 
 import java.time.Clock;
@@ -58,7 +57,7 @@ public class ShardManager<K, V> {
      * @see WorkManager#getWorkIfAvailable()
      */
     // performance: could disable/remove if using partition order - but probably not worth the added complexity in the code to handle an extra special case
-    private final Map<Object, ProcessingShard<K, V>> processingShards = new ConcurrentHashMap<>();
+    private final Map<ShardKey, ProcessingShard<K, V>> processingShards = new ConcurrentHashMap<>();
 
     private final NavigableSet<WorkContainer<?, ?>> retryQueue = new TreeSet<>(Comparator.comparing(wc -> wc.getDelayUntilRetryDue()));
 
@@ -66,31 +65,23 @@ public class ShardManager<K, V> {
      * Iteration resume point, to ensure fairness (prevent shard starvation) when we can't process messages from every
      * shard.
      */
-    private Optional<Object> iterationResumePoint = Optional.empty();
+    private Optional<ShardKey> iterationResumePoint = Optional.empty();
 
     /**
      * The shard belonging to the given key
      *
      * @return may return empty if the shard has since been removed
      */
-    // todo don't expose inner data structures - wrap instead
-    Optional<ProcessingShard<K, V>> getShard(Object key) {
+    Optional<ProcessingShard<K, V>> getShard(ShardKey key) {
         return Optional.ofNullable(processingShards.get(key));
     }
 
-    private LoopingResumingIterator<Object, ProcessingShard<K, V>> getIterator(final Optional<Object> iterationResumePoint) {
+    private LoopingResumingIterator<ShardKey, ProcessingShard<K, V>> getIterator(final Optional<ShardKey> iterationResumePoint) {
         return new LoopingResumingIterator<>(iterationResumePoint, this.processingShards);
     }
 
-    Object computeShardKey(ConsumerRecord<?, ?> rec) {
-        return switch (options.getOrdering()) {
-            case KEY -> rec.key();
-            case PARTITION, UNORDERED -> new TopicPartition(rec.topic(), rec.partition());
-        };
-    }
-
-    Object computeShardKey(WorkContainer<?, ?> wc) {
-        return computeShardKey(wc.getCr());
+    ShardKey computeShardKey(WorkContainer<?, ?> wc) {
+        return ShardKey.of(wc, options.getOrdering());
     }
 
     /**
@@ -120,7 +111,7 @@ void removeAnyShardsReferencedBy(NavigableMap<Long, WorkContainer<K, V>> workFro
     }
 
     private void removeShardFor(final WorkContainer<K, V> work) {
-        Object shardKey = computeShardKey(work.getCr());
+        ShardKey shardKey = computeShardKey(work);
 
         if (processingShards.containsKey(shardKey)) {
             ProcessingShard<K, V> shard = processingShards.get(shardKey);
@@ -134,14 +125,14 @@ private void removeShardFor(final WorkContainer<K, V> work) {
         this.retryQueue.remove(work);
     }
 
-    public void addWorkContainer(final WorkContainer<K, V> wc) {
-        Object shardKey = computeShardKey(wc.getCr());
+    public void addWorkContainer(WorkContainer<K, V> wc) {
+        ShardKey shardKey = computeShardKey(wc);
         var shard = processingShards.computeIfAbsent(shardKey,
                 (ignore) -> new ProcessingShard<>(shardKey, options, wm.getPm()));
         shard.addWorkContainer(wc);
     }
 
-    void removeShardIfEmpty(final Object key) {
+    void removeShardIfEmpty(ShardKey key) {
         Optional<ProcessingShard<K, V>> shardOpt = getShard(key);
 
         // If using KEY ordering, where the shard key is a message key, garbage collect old shard keys (i.e. KEY ordering we may never see a message for this key again)
@@ -157,7 +148,7 @@ public void onSuccess(WorkContainer<?, ?> wc) {
         this.retryQueue.remove(wc);
 
         // remove from processing queues
-        Object key = computeShardKey(wc);
+        var key = computeShardKey(wc);
         var shardOptional = getShard(key);
         if (shardOptional.isPresent()) {
             //
@@ -191,7 +182,7 @@ public Optional<Duration> getLowestRetryTime() {
     }
 
     public List<WorkContainer<K, V>> getWorkIfAvailable(final int requestedMaxWorkToRetrieve) {
-        LoopingResumingIterator<Object, ProcessingShard<K, V>> shardQueueIterator = getIterator(iterationResumePoint);
+        LoopingResumingIterator<ShardKey, ProcessingShard<K, V>> shardQueueIterator = getIterator(iterationResumePoint);
 
         //
         List<WorkContainer<K, V>> workFromAllShards = new ArrayList<>();
@@ -218,7 +209,7 @@ public List<WorkContainer<K, V>> getWorkIfAvailable(final int requestedMaxWorkTo
         return workFromAllShards;
     }
 
-    private void updateResumePoint(LoopingResumingIterator<Object, ProcessingShard<K, V>> shardQueueIterator) {
+    private void updateResumePoint(LoopingResumingIterator<ShardKey, ProcessingShard<K, V>> shardQueueIterator) {
         if (shardQueueIterator.hasNext()) {
             var shardEntry = shardQueueIterator.next();
             this.iterationResumePoint = Optional.of(shardEntry.getKey());
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index dca3cfc17..ef6e69fa8 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -1,17 +1,26 @@
+
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
 package io.confluent.parallelconsumer.integrationTests;
 
-import io.confluent.parallelconsumer.ManagedTruth;
-import io.confluent.parallelconsumer.ParallelConsumerOptions;
+import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
+import io.confluent.parallelconsumer.state.ShardKey;
+import io.confluent.parallelconsumer.state.ShardKey.KeyOrderedKey;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.NewTopic;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.hamcrest.Matchers;
+import org.junit.jupiter.api.Test;
 import org.junit.jupiter.params.ParameterizedTest;
 import org.junit.jupiter.params.provider.EnumSource;
 
 import java.util.List;
 import java.util.concurrent.atomic.AtomicInteger;
 
+import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static one.util.streamex.StreamEx.of;
 import static org.awaitility.Awaitility.await;
 import static org.hamcrest.Matchers.equalTo;
@@ -24,11 +33,11 @@ class MultiTopicTest extends BrokerIntegrationTest<String, String> {
 
 
     @ParameterizedTest
-    @EnumSource(ParallelConsumerOptions.ProcessingOrder.class)
-    void multiTopic(ParallelConsumerOptions.ProcessingOrder order) {
+    @EnumSource(ProcessingOrder.class)
+    void multiTopic(ProcessingOrder order) {
         int numTopics = 3;
         List<NewTopic> multiTopics = getKcu().createTopics(numTopics);
-        int recordsPerTopic = 333;
+        int recordsPerTopic = 1;
         multiTopics.forEach(singleTopic -> sendMessages(singleTopic, recordsPerTopic));
 
         var pc = getKcu().buildPc(order);
@@ -58,9 +67,31 @@ private void sendMessages(NewTopic newTopic, int recordsPerTopic) {
     }
 
     private void assertCommit(NewTopic newTopic, int recordsPerTopic) {
-        ManagedTruth.assertThat(getKcu().getLastConsumerConstructed())
+        assertThat(getKcu().getLastConsumerConstructed())
                 .hasCommittedToPartition(newTopic)
                 .offset(recordsPerTopic);
     }
 
+    @Test
+    void keyTest() {
+        ProcessingOrder ordering = KEY;
+        String topicOne = "t1";
+        String keyOne = "k1";
+
+        var reck1 = new ConsumerRecord<>(topicOne, 0, 0, keyOne, "v");
+        ShardKey key1 = ShardKey.of(reck1, ordering);
+        assertThat(key1).isEqualTo(ShardKey.of(reck1, ordering));
+
+        var reck2 = new ConsumerRecord<>(topicOne, 0, 0, "k2", "v");
+        ShardKey of3 = ShardKey.of(reck2, ordering);
+        assertThat(key1).isNotEqualTo(of3);
+
+        var reck3 = new ConsumerRecord<>("t2", 0, 0, keyOne, "v");
+        assertThat(key1).isNotEqualTo(ShardKey.of(reck3, ordering));
+
+        KeyOrderedKey keyOrderedKey = new KeyOrderedKey(topicOne, keyOne);
+        KeyOrderedKey keyOrderedKeyTwo = new KeyOrderedKey(topicOne, keyOne);
+        assertThat(keyOrderedKey).isEqualTo(keyOrderedKeyTwo);
+    }
+
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
new file mode 100644
index 000000000..3d73c37ce
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -0,0 +1,57 @@
+package io.confluent.parallelconsumer.truth;
+
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
+import com.google.common.truth.FailureMetadata;
+import io.confluent.parallelconsumer.model.CommitHistory;
+import io.stubbs.truth.generator.SubjectFactoryMethod;
+import io.stubbs.truth.generator.UserManagedTruth;
+import org.apache.kafka.clients.admin.NewTopic;
+import org.apache.kafka.clients.consumer.Consumer;
+import org.apache.kafka.clients.consumer.ConsumerParentSubject;
+import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import pl.tlinkowski.unij.api.UniSets;
+
+import javax.annotation.Generated;
+import java.time.Duration;
+import java.util.List;
+
+import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
+
+/**
+ * Optionally move this class into source control, and add your custom assertions here.
+ *
+ * <p>
+ * If the system detects this class already exists, it won't attempt to generate a new one. Note that if the base
+ * skeleton of this class ever changes, you won't automatically get it updated.
+ *
+ * @see Consumer
+ * @see ConsumerParentSubject
+ */
+@UserManagedTruth(Consumer.class)
+@Generated(value = "io.stubbs.truth.generator.internal.TruthGenerator", date = "2022-05-17T12:20:38.207945Z")
+public class ConsumerSubject extends ConsumerParentSubject {
+
+    private final Duration timeout = Duration.ofSeconds(10);
+
+    protected ConsumerSubject(FailureMetadata failureMetadata, org.apache.kafka.clients.consumer.Consumer actual) {
+        super(failureMetadata, actual);
+    }
+
+    /**
+     * Returns an assertion builder for a {@link Consumer} class.
+     */
+    @SubjectFactoryMethod
+    public static Factory<ConsumerSubject, Consumer> consumers() {
+        return ConsumerSubject::new;
+    }
+
+    public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
+        var committed = actual.committed(UniSets.of(topic), timeout);
+        List<OffsetAndMetadata> offsets = (List<OffsetAndMetadata>) committed.get(topic);
+        CommitHistory commitHistory = new CommitHistory(offsets);
+        return check("getCommitHistory(%s)", topic).about(commitHistories()).that(commitHistory);
+    }
+}

From 0a558f6f429d778d45eedd0baac235ed0d89bbf9 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 23 May 2022 15:28:19 -0400
Subject: [PATCH 028/131] step

---
 .../parallelconsumer/state/ProcessingShard.java       | 11 +++++------
 .../parallelconsumer/state/ShardManager.java          |  2 +-
 2 files changed, 6 insertions(+), 7 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
index 9727fcb73..e717d77b4 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
@@ -33,7 +33,10 @@ public class ProcessingShard<K, V> {
      * Map of offset to WorkUnits.
      * <p>
      * Uses a ConcurrentSkipListMap instead of a TreeMap as under high pressure there appears to be some concurrency
-     * errors (missing WorkContainers).
+     * errors (missing WorkContainers). This is addressed in PR#270.
+     * <p>
+     * Is a Map because need random access into collection, as records don't always complete in order (i.e. UNORDERED
+     * mode).
      */
     @Getter
     private final NavigableMap<Long, WorkContainer<K, V>> entries = new ConcurrentSkipListMap<>();
@@ -55,7 +58,7 @@ public boolean workIsWaitingToBeProcessed() {
     public void addWorkContainer(WorkContainer<K, V> wc) {
         long key = wc.offset();
         if (entries.containsKey(key)) {
-            log.debug("Entry for {} already exists in shard queue", wc);
+            log.debug("Entry for {} already exists in shard queue, dropping record", wc);
         } else {
             entries.put(key, wc);
         }
@@ -70,10 +73,6 @@ public boolean isEmpty() {
         return entries.isEmpty();
     }
 
-    public Optional<WorkContainer<K, V>> getWorkForOffset(long offset) {
-        return Optional.ofNullable(entries.get(offset));
-    }
-
     public long getCountOfWorkAwaitingSelection() {
         return entries.values().stream()
                 // todo missing pm.isBlocked(topicPartition) ?
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
index dbf497fce..9aba6f4b7 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
@@ -128,7 +128,7 @@ private void removeShardFor(final WorkContainer<K, V> work) {
     public void addWorkContainer(WorkContainer<K, V> wc) {
         ShardKey shardKey = computeShardKey(wc);
         var shard = processingShards.computeIfAbsent(shardKey,
-                (ignore) -> new ProcessingShard<>(shardKey, options, wm.getPm()));
+                ignore -> new ProcessingShard<>(shardKey, options, wm.getPm()));
         shard.addWorkContainer(wc);
     }
 

From 9628beeff6f2918460b10b9615b4bc57ecf7c086 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 24 May 2022 11:56:07 -0400
Subject: [PATCH 029/131] step

---
 .../java/io/confluent/parallelconsumer/state/ShardKey.java    | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
index f58b98ed0..b8268dadc 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
@@ -46,11 +46,11 @@ public static class KeyOrderedKey extends ShardKey {
          * Note: We use just the topic name here, and not the partition, so that if we were to receive records from the
          * same key from the partitions we're assigned, they will be put into the same queue.
          */
-        String topicName;
+        TopicPartition topicName;
         Object key;
 
         public KeyOrderedKey(final ConsumerRecord<?, ?> rec) {
-            this(rec.topic(), rec.key());
+            this(new TopicPartition(rec.topic(), rec.partition()), rec.key());
         }
     }
 

From b1fd89edf0d334084bf2d1ae9a5675639665cc71 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 24 May 2022 16:15:19 -0400
Subject: [PATCH 030/131] step

---
 .../io/confluent/parallelconsumer/state/ProcessingShard.java    | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
index e717d77b4..90a9d1e97 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
@@ -42,7 +42,7 @@ public class ProcessingShard<K, V> {
     private final NavigableMap<Long, WorkContainer<K, V>> entries = new ConcurrentSkipListMap<>();
 
     @Getter(PRIVATE)
-    private final Object key;
+    private final ShardKey key;
 
     private final ParallelConsumerOptions<?, ?> options;
 

From d2371588f6fbb04eb948cf2bf1d6bba058edbd30 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 24 May 2022 16:03:58 -0400
Subject: [PATCH 031/131] turn off ossindex for guava 31.1

https://ossindex.sonatype.org/component/pkg:maven/com.google.guava/guava@31.1-jre?utm_source=ossindex-client&utm_medium=integration&utm_content=1.8.1
---
 pom.xml | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/pom.xml b/pom.xml
index f0ed2a681..31bb5b534 100644
--- a/pom.xml
+++ b/pom.xml
@@ -491,6 +491,10 @@
                 <groupId>org.sonatype.ossindex.maven</groupId>
                 <artifactId>ossindex-maven-plugin</artifactId>
                 <version>3.2.0</version>
+                <configuration>
+                    <!-- com.google.guava:guava:jar:31.1-jre:test; - no update yet -->
+                    <fail>false</fail>
+                </configuration>
                 <executions>
                     <execution>
                         <id>audit-dependencies</id>

From d8ea9834ab5b718a4913e1da5de52aae98926662 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 24 May 2022 18:03:51 -0400
Subject: [PATCH 032/131] step

---
 .../parallelconsumer/integrationTests/MultiTopicTest.java   | 6 ++++--
 .../confluent/parallelconsumer/truth/ConsumerSubject.java   | 5 +++--
 2 files changed, 7 insertions(+), 4 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index ef6e69fa8..34437976e 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -11,6 +11,7 @@
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.NewTopic;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.common.TopicPartition;
 import org.hamcrest.Matchers;
 import org.junit.jupiter.api.Test;
 import org.junit.jupiter.params.ParameterizedTest;
@@ -89,8 +90,9 @@ void keyTest() {
         var reck3 = new ConsumerRecord<>("t2", 0, 0, keyOne, "v");
         assertThat(key1).isNotEqualTo(ShardKey.of(reck3, ordering));
 
-        KeyOrderedKey keyOrderedKey = new KeyOrderedKey(topicOne, keyOne);
-        KeyOrderedKey keyOrderedKeyTwo = new KeyOrderedKey(topicOne, keyOne);
+        var tp = new TopicPartition(topicOne, 0);
+        KeyOrderedKey keyOrderedKey = new KeyOrderedKey(tp, keyOne);
+        KeyOrderedKey keyOrderedKeyTwo = new KeyOrderedKey(tp, keyOne);
         assertThat(keyOrderedKey).isEqualTo(keyOrderedKeyTwo);
     }
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
index 3d73c37ce..a41dd8a31 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -34,8 +34,6 @@
 @Generated(value = "io.stubbs.truth.generator.internal.TruthGenerator", date = "2022-05-17T12:20:38.207945Z")
 public class ConsumerSubject extends ConsumerParentSubject {
 
-    private final Duration timeout = Duration.ofSeconds(10);
-
     protected ConsumerSubject(FailureMetadata failureMetadata, org.apache.kafka.clients.consumer.Consumer actual) {
         super(failureMetadata, actual);
     }
@@ -48,10 +46,13 @@ public static Factory<ConsumerSubject, Consumer> consumers() {
         return ConsumerSubject::new;
     }
 
+    private final Duration timeout = Duration.ofSeconds(10);
+
     public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
         var committed = actual.committed(UniSets.of(topic), timeout);
         List<OffsetAndMetadata> offsets = (List<OffsetAndMetadata>) committed.get(topic);
         CommitHistory commitHistory = new CommitHistory(offsets);
         return check("getCommitHistory(%s)", topic).about(commitHistories()).that(commitHistory);
     }
+
 }

From b883ba02e15156ac10195477f7a1d9e61aff7d9e Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 24 May 2022 18:06:17 -0400
Subject: [PATCH 033/131] step - extract

---
 .../integrationTests/MultiTopicTest.java      | 30 -------------
 .../parallelconsumer/state/ShardKeyTest.java  | 44 +++++++++++++++++++
 2 files changed, 44 insertions(+), 30 deletions(-)
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index 34437976e..d4bb032a2 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -5,15 +5,10 @@
 package io.confluent.parallelconsumer.integrationTests;
 
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
-import io.confluent.parallelconsumer.state.ShardKey;
-import io.confluent.parallelconsumer.state.ShardKey.KeyOrderedKey;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.NewTopic;
-import org.apache.kafka.clients.consumer.ConsumerRecord;
-import org.apache.kafka.common.TopicPartition;
 import org.hamcrest.Matchers;
-import org.junit.jupiter.api.Test;
 import org.junit.jupiter.params.ParameterizedTest;
 import org.junit.jupiter.params.provider.EnumSource;
 
@@ -21,7 +16,6 @@
 import java.util.concurrent.atomic.AtomicInteger;
 
 import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
-import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static one.util.streamex.StreamEx.of;
 import static org.awaitility.Awaitility.await;
 import static org.hamcrest.Matchers.equalTo;
@@ -32,7 +26,6 @@
 @Slf4j
 class MultiTopicTest extends BrokerIntegrationTest<String, String> {
 
-
     @ParameterizedTest
     @EnumSource(ProcessingOrder.class)
     void multiTopic(ProcessingOrder order) {
@@ -73,27 +66,4 @@ private void assertCommit(NewTopic newTopic, int recordsPerTopic) {
                 .offset(recordsPerTopic);
     }
 
-    @Test
-    void keyTest() {
-        ProcessingOrder ordering = KEY;
-        String topicOne = "t1";
-        String keyOne = "k1";
-
-        var reck1 = new ConsumerRecord<>(topicOne, 0, 0, keyOne, "v");
-        ShardKey key1 = ShardKey.of(reck1, ordering);
-        assertThat(key1).isEqualTo(ShardKey.of(reck1, ordering));
-
-        var reck2 = new ConsumerRecord<>(topicOne, 0, 0, "k2", "v");
-        ShardKey of3 = ShardKey.of(reck2, ordering);
-        assertThat(key1).isNotEqualTo(of3);
-
-        var reck3 = new ConsumerRecord<>("t2", 0, 0, keyOne, "v");
-        assertThat(key1).isNotEqualTo(ShardKey.of(reck3, ordering));
-
-        var tp = new TopicPartition(topicOne, 0);
-        KeyOrderedKey keyOrderedKey = new KeyOrderedKey(tp, keyOne);
-        KeyOrderedKey keyOrderedKeyTwo = new KeyOrderedKey(tp, keyOne);
-        assertThat(keyOrderedKey).isEqualTo(keyOrderedKeyTwo);
-    }
-
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
new file mode 100644
index 000000000..d0f528088
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
@@ -0,0 +1,44 @@
+package io.confluent.parallelconsumer.state;
+
+import io.confluent.parallelconsumer.ParallelConsumerOptions;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.junit.jupiter.api.Test;
+
+import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
+
+class ShardKeyTest {
+
+    @Test
+    void keyTest() {
+        ParallelConsumerOptions.ProcessingOrder ordering = KEY;
+        String topicOne = "t1";
+        String keyOne = "k1";
+
+        var reck1 = new ConsumerRecord<>(topicOne, 0, 0, keyOne, "v");
+        ShardKey key1 = ShardKey.of(reck1, ordering);
+        assertThat(key1).isEqualTo(ShardKey.of(reck1, ordering));
+
+        // same topic, same partition, different key
+        var reck2 = new ConsumerRecord<>(topicOne, 0, 0, "k2", "v");
+        ShardKey of3 = ShardKey.of(reck2, ordering);
+        assertThat(key1).isNotEqualTo(of3);
+
+        // different topic, same key
+        var reck3 = new ConsumerRecord<>("t2", 0, 0, keyOne, "v");
+        assertThat(key1).isNotEqualTo(ShardKey.of(reck3, ordering));
+
+        // same topic, same key
+        ShardKey.KeyOrderedKey keyOrderedKey = new ShardKey.KeyOrderedKey(topicOne, keyOne);
+        ShardKey.KeyOrderedKey keyOrderedKeyTwo = new ShardKey.KeyOrderedKey(topicOne, keyOne);
+        assertThat(keyOrderedKey).isEqualTo(keyOrderedKeyTwo);
+
+        // same topic, same key, different partition
+        var reck4 = new ConsumerRecord<>(topicOne, 1, 0, keyOne, "v");
+        ShardKey of4 = ShardKey.of(reck2, ordering);
+        assertThat(key1).isNotEqualTo(of3);
+        // check both exist in queue too
+        assertThat("false").isEmpty();
+    }
+
+}

From 4219a99fd1aabeb6d60b10580b064dbd05aed87d Mon Sep 17 00:00:00 2001
From: "dependabot[bot]" <49699333+dependabot[bot]@users.noreply.github.com>
Date: Wed, 25 May 2022 17:21:34 +0000
Subject: [PATCH 034/131] build(deps): bump vertx.version from 4.3.0 to 4.3.1

Bumps `vertx.version` from 4.3.0 to 4.3.1.

Updates `vertx-web-client` from 4.3.0 to 4.3.1

Updates `vertx-junit5` from 4.3.0 to 4.3.1

---
updated-dependencies:
- dependency-name: io.vertx:vertx-web-client
  dependency-type: direct:production
  update-type: version-update:semver-patch
- dependency-name: io.vertx:vertx-junit5
  dependency-type: direct:development
  update-type: version-update:semver-patch
...

Signed-off-by: dependabot[bot] <support@github.com>
---
 parallel-consumer-vertx/pom.xml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-vertx/pom.xml b/parallel-consumer-vertx/pom.xml
index ab632bd85..61f381195 100644
--- a/parallel-consumer-vertx/pom.xml
+++ b/parallel-consumer-vertx/pom.xml
@@ -17,7 +17,7 @@
     <modelVersion>4.0.0</modelVersion>
 
     <properties>
-        <vertx.version>4.3.0</vertx.version>
+        <vertx.version>4.3.1</vertx.version>
     </properties>
 
     <dependencies>

From ae21fb71c9c023f583e6196ff6d8636be907007a Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 26 May 2022 06:48:58 -0400
Subject: [PATCH 035/131] step - tg demo, keep consumer open

---
 parallel-consumer-core/pom.xml                |  1 +
 .../AbstractParallelEoSStreamProcessor.java   |  5 +++++
 .../internal/BrokerPollSystem.java            |  1 +
 .../integrationTests/MultiTopicTest.java      | 15 ++++++++-----
 .../parallelconsumer/state/ShardKeyTest.java  |  6 ++++--
 .../truth/CommitHistorySubject.java           |  9 ++++++--
 .../truth/ConsumerSubject.java                | 21 +++++++++++++++----
 pom.xml                                       |  2 +-
 8 files changed, 46 insertions(+), 14 deletions(-)

diff --git a/parallel-consumer-core/pom.xml b/parallel-consumer-core/pom.xml
index 65bfac65d..abc2b34b9 100644
--- a/parallel-consumer-core/pom.xml
+++ b/parallel-consumer-core/pom.xml
@@ -126,6 +126,7 @@
                     <releaseTarget>8</releaseTarget>
                     <classes>
                         <class>io.confluent.parallelconsumer.PollContext</class>
+                        <class>io.confluent.parallelconsumer.ParallelEoSStreamProcessor</class>
                         <class>io.confluent.parallelconsumer.state.WorkContainer</class>
                         <class>io.confluent.parallelconsumer.state.WorkManager</class>
                         <class>io.confluent.parallelconsumer.state.PartitionState</class>
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
index 5f186fb93..2aafe77e7 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
@@ -41,6 +41,7 @@
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.internal.State.*;
 import static java.time.Duration.ofMillis;
+import static java.time.Duration.ofSeconds;
 import static java.util.concurrent.TimeUnit.MILLISECONDS;
 import static java.util.concurrent.TimeUnit.SECONDS;
 import static lombok.AccessLevel.PRIVATE;
@@ -106,6 +107,10 @@ public abstract class AbstractParallelEoSStreamProcessor<K, V> implements Parall
     @Getter(PROTECTED)
     private final BlockingQueue<ControllerEventMessage<K, V>> workMailBox = new LinkedBlockingQueue<>(); // Thread safe, highly performant, non blocking
 
+    public void closeWithoutClosingClients() {
+        close(ofSeconds(30), DrainingMode.DRAIN);
+    }
+
     /**
      * An inbound message to the controller.
      * <p>
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java
index b94151b9f..ada42a953 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java
@@ -162,6 +162,7 @@ private void doClose() {
     private void maybeCloseConsumerManager() {
         if (isResponsibleForCommits()) {
             log.debug("Closing {}, first closing consumer...", this.getClass().getSimpleName());
+// remove to keep consumer open
             this.consumerManager.close(DrainingCloseable.DEFAULT_TIMEOUT);
             log.debug("Consumer closed.");
         }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index d4bb032a2..810fc6fbf 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -5,6 +5,7 @@
 package io.confluent.parallelconsumer.integrationTests;
 
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
+import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.NewTopic;
@@ -12,6 +13,7 @@
 import org.junit.jupiter.params.ParameterizedTest;
 import org.junit.jupiter.params.provider.EnumSource;
 
+import java.time.Duration;
 import java.util.List;
 import java.util.concurrent.atomic.AtomicInteger;
 
@@ -49,9 +51,11 @@ void multiTopic(ProcessingOrder order) {
         await().untilAtomic(messageProcessedCount, Matchers.is(equalTo(expectedMessagesCount)));
 
         // commits
-//        await().untilAsserted(() -> {
-//            multiTopics.forEach(singleTopic -> assertCommit(singleTopic, recordsPerTopic));
-//        });
+//        pc.closeWithoutClosingClients();
+        pc.close();
+        await().atMost(Duration.ofSeconds(1)).untilAsserted(() -> {
+            multiTopics.forEach(singleTopic -> assertCommit(pc, singleTopic, recordsPerTopic + 1));
+        });
     }
 
 
@@ -60,8 +64,9 @@ private void sendMessages(NewTopic newTopic, int recordsPerTopic) {
         getKcu().produceMessages(newTopic.name(), recordsPerTopic);
     }
 
-    private void assertCommit(NewTopic newTopic, int recordsPerTopic) {
-        assertThat(getKcu().getLastConsumerConstructed())
+    private void assertCommit(final ParallelEoSStreamProcessor<String, String> pc, NewTopic newTopic, int recordsPerTopic) {
+        var committer = getKcu().getLastConsumerConstructed();
+        assertThat(committer)
                 .hasCommittedToPartition(newTopic)
                 .offset(recordsPerTopic);
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
index d0f528088..d3175fe6c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
@@ -2,6 +2,7 @@
 
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.common.TopicPartition;
 import org.junit.jupiter.api.Test;
 
 import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
@@ -13,6 +14,7 @@ class ShardKeyTest {
     void keyTest() {
         ParallelConsumerOptions.ProcessingOrder ordering = KEY;
         String topicOne = "t1";
+        TopicPartition topicOneP0 = new TopicPartition("t1", 0);
         String keyOne = "k1";
 
         var reck1 = new ConsumerRecord<>(topicOne, 0, 0, keyOne, "v");
@@ -29,8 +31,8 @@ void keyTest() {
         assertThat(key1).isNotEqualTo(ShardKey.of(reck3, ordering));
 
         // same topic, same key
-        ShardKey.KeyOrderedKey keyOrderedKey = new ShardKey.KeyOrderedKey(topicOne, keyOne);
-        ShardKey.KeyOrderedKey keyOrderedKeyTwo = new ShardKey.KeyOrderedKey(topicOne, keyOne);
+        ShardKey.KeyOrderedKey keyOrderedKey = new ShardKey.KeyOrderedKey(topicOneP0, keyOne);
+        ShardKey.KeyOrderedKey keyOrderedKeyTwo = new ShardKey.KeyOrderedKey(topicOneP0, keyOne);
         assertThat(keyOrderedKey).isEqualTo(keyOrderedKeyTwo);
 
         // same topic, same key, different partition
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
index a1ad3db8a..e5532e119 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
@@ -46,7 +46,7 @@ public void atLeastOffset(int needleCommit) {
     }
 
     public void offset(long quantity) {
-        check("atLeastOffset()").that(actual.getOffsetHistory()).contains(quantity);
+        check("getOffsetHistory()").that(actual.getOffsetHistory()).contains(quantity);
     }
 
     public void anything() {
@@ -60,5 +60,10 @@ public void nothing() {
     public void isEmpty() {
         nothing();
     }
-
+//
+//    @Override
+//    protected String actualCustomStringRepresentation() {
+////        String s = actual.;
+//        return super.actualCustomStringRepresentation();
+//    }
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
index a41dd8a31..8daf5b826 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -12,11 +12,13 @@
 import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerParentSubject;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import org.apache.kafka.common.TopicPartition;
+import pl.tlinkowski.unij.api.UniLists;
 import pl.tlinkowski.unij.api.UniSets;
 
 import javax.annotation.Generated;
 import java.time.Duration;
-import java.util.List;
+import java.util.Map;
 
 import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
 
@@ -49,10 +51,21 @@ public static Factory<ConsumerSubject, Consumer> consumers() {
     private final Duration timeout = Duration.ofSeconds(10);
 
     public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
-        var committed = actual.committed(UniSets.of(topic), timeout);
-        List<OffsetAndMetadata> offsets = (List<OffsetAndMetadata>) committed.get(topic);
-        CommitHistory commitHistory = new CommitHistory(offsets);
+        int defaultPartition = 0;
+        TopicPartition tp = new TopicPartition(topic.name(), defaultPartition);
+        var committed = (Map<TopicPartition, OffsetAndMetadata>) actual.committed(UniSets.of(tp), timeout);
+        OffsetAndMetadata offsets = committed.get(tp);
+        CommitHistory commitHistory = new CommitHistory(UniLists.of(offsets));
         return check("getCommitHistory(%s)", topic).about(commitHistories()).that(commitHistory);
     }
 
+//    @Override
+//    protected String actualCustomStringRepresentation() {
+//        String assignors = ReflectionToStringBuilder.toStringExclude(actual,
+//                "assignors", "client", "time", "kafkaConsumerMetrics", "coordinator", "log", "metrics", "fetcher",
+//                "keyDeserializer", "valueDeserializer", "interceptors", "cachedSubscriptionHashAllFetchPositions", "metadata"
+//        );
+//        return assignors;
+//    }
+
 }
diff --git a/pom.xml b/pom.xml
index 31bb5b534..d99f8999f 100644
--- a/pom.xml
+++ b/pom.xml
@@ -112,7 +112,7 @@
         <truth.version>1.1.3</truth.version>
         <flogger.version>0.7.4</flogger.version>
         <mockito.version>4.5.1</mockito.version>
-        <truth-generator-maven-plugin.version>0.1</truth-generator-maven-plugin.version>
+        <truth-generator-maven-plugin.version>0.1.1-SNAPSHOT</truth-generator-maven-plugin.version>
         <jabel.version>0.4.2</jabel.version>
     </properties>
 

From ad6c89e60d9f7fa9efd00f3923f59dfc5782de2b Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 1 Jun 2022 12:12:48 +0100
Subject: [PATCH 036/131] test for null keys

---
 .../parallelconsumer/state/ShardKey.java      |  9 +++++++-
 .../parallelconsumer/state/ShardKeyTest.java  | 22 +++++++++++++++++++
 2 files changed, 30 insertions(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
index b8268dadc..2fd66c01e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
@@ -11,7 +11,9 @@
 import org.apache.kafka.common.TopicPartition;
 
 /**
- * todo docs
+ * Simple value class for processing {@link ShardKey}s to make the various key systems type safe and extendable.
+ *
+ * @see ShardKeyTest
  */
 @Getter
 @FieldDefaults(makeFinal = true, level = AccessLevel.PRIVATE)
@@ -42,11 +44,16 @@ public static ShardKey ofTopicPartition(final ConsumerRecord<?, ?> rec) {
     @RequiredArgsConstructor
     @EqualsAndHashCode(callSuper = true)
     public static class KeyOrderedKey extends ShardKey {
+
         /**
          * Note: We use just the topic name here, and not the partition, so that if we were to receive records from the
          * same key from the partitions we're assigned, they will be put into the same queue.
          */
         TopicPartition topicName;
+
+        /**
+         * The key of the record being referenced. Nullable if record is produced with a null key.
+         */
         Object key;
 
         public KeyOrderedKey(final ConsumerRecord<?, ?> rec) {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
index d3175fe6c..bf8f31bc6 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
@@ -7,9 +7,31 @@
 
 import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
+import static org.mockito.Mockito.mock;
+import static org.mockito.Mockito.when;
 
+/**
+ * @see ShardKey
+ */
 class ShardKeyTest {
 
+    /**
+     * Tests when KEY ordering with `null` keyed records
+     */
+    @Test
+    void nullKey() {
+        var cr = mock(ConsumerRecord.class);
+        when(cr.partition()).thenReturn(0);
+        when(cr.topic()).thenReturn("atopic");
+        when(cr.key()).thenReturn(null);
+
+        var wc = mock(WorkContainer.class);
+        when(wc.getCr()).thenReturn(cr);
+
+        ShardKey.of(wc, KEY);
+    }
+
+    // todo split
     @Test
     void keyTest() {
         ParallelConsumerOptions.ProcessingOrder ordering = KEY;

From 23e5389c17794510b68731b3b7d9786820eacad8 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 1 Jun 2022 12:12:57 +0100
Subject: [PATCH 037/131] allow truth snapshot

---
 pom.xml | 1 +
 1 file changed, 1 insertion(+)

diff --git a/pom.xml b/pom.xml
index d99f8999f..65b5944e5 100644
--- a/pom.xml
+++ b/pom.xml
@@ -728,6 +728,7 @@
                                     <onlyWhenRelease>false</onlyWhenRelease>
                                     <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>
                                     <excludes>
+                                        <exclude>io.stubbs.truth:</exclude>
                                         <exclude>io.confluent.parallelconsumer:</exclude>
                                     </excludes>
                                 </requireReleaseDeps>

From 7fdb06a57e80d8d6aaee963911f930a5a3f8e5ee Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 10 Jun 2022 14:14:36 +0100
Subject: [PATCH 038/131] add missing annotations

---
 .../parallelconsumer/truth/CommitHistorySubject.java        | 5 +++++
 .../truth/LongPollingMockConsumerSubject.java               | 6 +++++-
 2 files changed, 10 insertions(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
index e5532e119..6bd171c26 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
@@ -3,10 +3,13 @@
 /*-
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
+
 import com.google.common.truth.FailureMetadata;
 import com.google.common.truth.OptionalSubject;
 import com.google.common.truth.Subject;
 import io.confluent.parallelconsumer.model.CommitHistory;
+import io.stubbs.truth.generator.SubjectFactoryMethod;
+import io.stubbs.truth.generator.UserManagedTruth;
 
 import java.util.Optional;
 
@@ -15,6 +18,7 @@
 /**
  * @see CommitHistory
  */
+@UserManagedTruth(CommitHistory.class)
 public class CommitHistorySubject extends Subject {
     private final CommitHistory actual;
 
@@ -23,6 +27,7 @@ protected CommitHistorySubject(FailureMetadata metadata, CommitHistory actual) {
         this.actual = actual;
     }
 
+    @SubjectFactoryMethod
     public static Factory<CommitHistorySubject, CommitHistory> commitHistories() {
         return CommitHistorySubject::new;
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
index a94b6fffb..07230dda9 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
@@ -8,6 +8,8 @@
 import com.google.common.truth.Subject;
 import io.confluent.csid.utils.LongPollingMockConsumer;
 import io.confluent.parallelconsumer.model.CommitHistory;
+import io.stubbs.truth.generator.SubjectFactoryMethod;
+import io.stubbs.truth.generator.UserManagedTruth;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 
@@ -19,6 +21,7 @@
 import static com.google.common.truth.Truth.assertAbout;
 import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
 
+@UserManagedTruth(LongPollingMockConsumer.class)
 public class LongPollingMockConsumerSubject<K, V> extends Subject {
 
     private final LongPollingMockConsumer<K, V> actual;
@@ -28,6 +31,7 @@ protected LongPollingMockConsumerSubject(FailureMetadata metadata, LongPollingMo
         this.actual = actual;
     }
 
+    @SubjectFactoryMethod
     public static <K, V> Factory<LongPollingMockConsumerSubject<K, V>, LongPollingMockConsumer<K, V>> mockConsumers() {
         return LongPollingMockConsumerSubject::new;
     }
@@ -37,7 +41,7 @@ public static <K, V> LongPollingMockConsumerSubject<K, V> assertTruth(final Long
     }
 
     public static <K, V> LongPollingMockConsumerSubject<K, V> assertThat(final LongPollingMockConsumer<K, V> actual) {
-        Factory<LongPollingMockConsumerSubject<K, V>, LongPollingMockConsumer<K, V>> factory = LongPollingMockConsumerSubject.<K, V>mockConsumers();
+        Factory<LongPollingMockConsumerSubject<K, V>, LongPollingMockConsumer<K, V>> factory = LongPollingMockConsumerSubject.mockConsumers();
         return assertAbout(factory).that(actual);
     }
 

From 3e611d8841cf11c8edcbb8e7abfa24879284d173 Mon Sep 17 00:00:00 2001
From: "dependabot[bot]" <49699333+dependabot[bot]@users.noreply.github.com>
Date: Fri, 10 Jun 2022 16:40:54 +0000
Subject: [PATCH 039/131] build(deps-dev): bump postgresql from 42.3.5 to
 42.4.0

Bumps [postgresql](https://github.com/pgjdbc/pgjdbc) from 42.3.5 to 42.4.0.
- [Release notes](https://github.com/pgjdbc/pgjdbc/releases)
- [Changelog](https://github.com/pgjdbc/pgjdbc/blob/master/CHANGELOG.md)
- [Commits](https://github.com/pgjdbc/pgjdbc/compare/REL42.3.5...REL42.4.0)

---
updated-dependencies:
- dependency-name: org.postgresql:postgresql
  dependency-type: direct:development
  update-type: version-update:semver-minor
...

Signed-off-by: dependabot[bot] <support@github.com>
---
 parallel-consumer-core/pom.xml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-core/pom.xml b/parallel-consumer-core/pom.xml
index fd4e74886..ba583be3d 100644
--- a/parallel-consumer-core/pom.xml
+++ b/parallel-consumer-core/pom.xml
@@ -85,7 +85,7 @@
         <dependency>
             <groupId>org.postgresql</groupId>
             <artifactId>postgresql</artifactId>
-            <version>42.3.5</version>
+            <version>42.4.0</version>
             <scope>test</scope>
         </dependency>
         <dependency>

From 03ff349e41b3dc8109385150aa4363349f3475c2 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 25 Jun 2022 12:59:43 +0300
Subject: [PATCH 040/131] step

---
 .../parallelconsumer/state/ShardKeyTest.java    |  4 ++++
 pom.xml                                         | 17 +++++++++--------
 2 files changed, 13 insertions(+), 8 deletions(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
index bf8f31bc6..2bf017487 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
@@ -1,5 +1,9 @@
 package io.confluent.parallelconsumer.state;
 
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.common.TopicPartition;
diff --git a/pom.xml b/pom.xml
index 65b5944e5..6f5215ed9 100644
--- a/pom.xml
+++ b/pom.xml
@@ -520,6 +520,7 @@
                 <groupId>io.whelk.asciidoc</groupId>
                 <artifactId>asciidoc-template-maven-plugin</artifactId>
                 <version>1.0.20</version>
+                <inherited>false</inherited>
                 <executions>
                     <execution>
                         <id>process</id>
@@ -804,14 +805,14 @@
                     <outputDirectory>${delombok.output}</outputDirectory>
                     <addOutputDirectory>false</addOutputDirectory>
                 </configuration>
-                <executions>
-                    <execution>
-                        <phase>generate-sources</phase>
-                        <goals>
-                            <goal>delombok</goal>
-                        </goals>
-                    </execution>
-                </executions>
+                <!--                <executions>-->
+                <!--                    <execution>-->
+                <!--                        <phase>generate-sources</phase>-->
+                <!--                        <goals>-->
+                <!--                            <goal>delombok</goal>-->
+                <!--                        </goals>-->
+                <!--                    </execution>-->
+                <!--                </executions>-->
             </plugin>
             <plugin>
                 <groupId>org.apache.maven.plugins</groupId>

From 72ac26402c8fbdbfb79cd60858b433310ddb6243 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 1 Jun 2022 12:41:02 +0100
Subject: [PATCH 041/131] build: Exclude Guava 31.1 from OSSIndex sec scan

- CVE-2020-8908: Files::createTempDir local information disclosure vulnerability #4011
- Only used transitively from tests, and is a deprecated function
- https://github.com/google/guava/issues/4011
---
 README.adoc |  6 +++---
 pom.xml     | 12 ++++++++++++
 2 files changed, 15 insertions(+), 3 deletions(-)

diff --git a/README.adoc b/README.adoc
index 749fd9505..34766a977 100644
--- a/README.adoc
+++ b/README.adoc
@@ -70,7 +70,7 @@ It also opens up new use cases like extreme parallelism, external data enrichmen
 .Consume many messages _concurrently_ with a *single* consumer instance:
 [source,java,indent=0]
 ----
-        parallelConsumer.poll(record ->
+                        parallelConsumer.poll(record ->
                 log.info("Concurrently processing a record: {}", record)
         );
 ----
@@ -438,7 +438,7 @@ Where `${project.version}` is the version to be used:
                 .producer(kafkaProducer)
                 .build();
 
-        ParallelStreamProcessor<String, String> eosStreamProcessor =
+        ParallelEoSStreamProcessor<String, String> eosStreamProcessor =
                 ParallelStreamProcessor.createEosStreamProcessor(options);
 
         eosStreamProcessor.subscribe(of(inputTopic)); // <4>
@@ -489,7 +489,7 @@ This is the only thing you need to do, in order to get massively concurrent proc
 
 .Usage - print message content out to the console in parallel
 [source,java,indent=0]
-        parallelConsumer.poll(record ->
+                        parallelConsumer.poll(record ->
                 log.info("Concurrently processing a record: {}", record)
         );
 
diff --git a/pom.xml b/pom.xml
index f0ed2a681..21a01eb96 100644
--- a/pom.xml
+++ b/pom.xml
@@ -491,6 +491,18 @@
                 <groupId>org.sonatype.ossindex.maven</groupId>
                 <artifactId>ossindex-maven-plugin</artifactId>
                 <version>3.2.0</version>
+                <configuration>
+                    <excludeCoordinates>
+                        <exclude>
+                            <!-- https://github.com/google/guava/issues/4011 -->
+                            <!-- CVE-2020-8908: Files::createTempDir local information disclosure vulnerability #4011 -->
+                            <!-- only used transitively from tests, and is a deprecated function -->
+                            <groupId>com.google.guava</groupId>
+                            <artifactId>guava</artifactId>
+                            <version>31.1-jre</version>
+                        </exclude>
+                    </excludeCoordinates>
+                </configuration>
                 <executions>
                     <execution>
                         <id>audit-dependencies</id>

From f905cdbe1a252c1765b5cb5810ab7fc7aeae3531 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 09:10:54 +0100
Subject: [PATCH 042/131] ...

---
 README.adoc | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/README.adoc b/README.adoc
index 34766a977..749fd9505 100644
--- a/README.adoc
+++ b/README.adoc
@@ -70,7 +70,7 @@ It also opens up new use cases like extreme parallelism, external data enrichmen
 .Consume many messages _concurrently_ with a *single* consumer instance:
 [source,java,indent=0]
 ----
-                        parallelConsumer.poll(record ->
+        parallelConsumer.poll(record ->
                 log.info("Concurrently processing a record: {}", record)
         );
 ----
@@ -438,7 +438,7 @@ Where `${project.version}` is the version to be used:
                 .producer(kafkaProducer)
                 .build();
 
-        ParallelEoSStreamProcessor<String, String> eosStreamProcessor =
+        ParallelStreamProcessor<String, String> eosStreamProcessor =
                 ParallelStreamProcessor.createEosStreamProcessor(options);
 
         eosStreamProcessor.subscribe(of(inputTopic)); // <4>
@@ -489,7 +489,7 @@ This is the only thing you need to do, in order to get massively concurrent proc
 
 .Usage - print message content out to the console in parallel
 [source,java,indent=0]
-                        parallelConsumer.poll(record ->
+        parallelConsumer.poll(record ->
                 log.info("Concurrently processing a record: {}", record)
         );
 

From 12dc7cfe44721a8674a90ad1a465766132c0f3ca Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 09:22:03 +0100
Subject: [PATCH 043/131] build: Update to Truth-Generator 0.1.1 for Subject
 discovery

---
 pom.xml | 54 +++++++++++++++++++++++++++---------------------------
 1 file changed, 27 insertions(+), 27 deletions(-)

diff --git a/pom.xml b/pom.xml
index 21a01eb96..c4e9342ff 100644
--- a/pom.xml
+++ b/pom.xml
@@ -112,7 +112,7 @@
         <truth.version>1.1.3</truth.version>
         <flogger.version>0.7.4</flogger.version>
         <mockito.version>4.5.1</mockito.version>
-        <truth-generator-maven-plugin.version>0.1</truth-generator-maven-plugin.version>
+        <truth-generator-maven-plugin.version>0.1.1</truth-generator-maven-plugin.version>
         <jabel.version>0.4.2</jabel.version>
     </properties>
 
@@ -487,32 +487,32 @@
                     </execution>
                 </executions>
             </plugin>
-            <plugin>
-                <groupId>org.sonatype.ossindex.maven</groupId>
-                <artifactId>ossindex-maven-plugin</artifactId>
-                <version>3.2.0</version>
-                <configuration>
-                    <excludeCoordinates>
-                        <exclude>
-                            <!-- https://github.com/google/guava/issues/4011 -->
-                            <!-- CVE-2020-8908: Files::createTempDir local information disclosure vulnerability #4011 -->
-                            <!-- only used transitively from tests, and is a deprecated function -->
-                            <groupId>com.google.guava</groupId>
-                            <artifactId>guava</artifactId>
-                            <version>31.1-jre</version>
-                        </exclude>
-                    </excludeCoordinates>
-                </configuration>
-                <executions>
-                    <execution>
-                        <id>audit-dependencies</id>
-                        <phase>validate</phase>
-                        <goals>
-                            <goal>audit</goal>
-                        </goals>
-                    </execution>
-                </executions>
-            </plugin>
+            <!--            <plugin>-->
+            <!--                <groupId>org.sonatype.ossindex.maven</groupId>-->
+            <!--                <artifactId>ossindex-maven-plugin</artifactId>-->
+            <!--                <version>3.2.0</version>-->
+            <!--                <configuration>-->
+            <!--                    <excludeCoordinates>-->
+            <!--                        <exclude>-->
+            <!--                            &lt;!&ndash; https://github.com/google/guava/issues/4011 &ndash;&gt;-->
+            <!--                            &lt;!&ndash; CVE-2020-8908: Files::createTempDir local information disclosure vulnerability #4011 &ndash;&gt;-->
+            <!--                            &lt;!&ndash; only used transitively from tests, and is a deprecated function &ndash;&gt;-->
+            <!--                            <groupId>com.google.guava</groupId>-->
+            <!--                            <artifactId>guava</artifactId>-->
+            <!--                            <version>31.1-jre</version>-->
+            <!--                        </exclude>-->
+            <!--                    </excludeCoordinates>-->
+            <!--                </configuration>-->
+            <!--                <executions>-->
+            <!--                    <execution>-->
+            <!--                        <id>audit-dependencies</id>-->
+            <!--                        <phase>validate</phase>-->
+            <!--                        <goals>-->
+            <!--                            <goal>audit</goal>-->
+            <!--                        </goals>-->
+            <!--                    </execution>-->
+            <!--                </executions>-->
+            <!--            </plugin>-->
             <plugin>
                 <groupId>com.soebes.maven.plugins</groupId>
                 <artifactId>echo-maven-plugin</artifactId>

From 3e468a7b9503ff01ade3c18efbca3d187cbe1fe6 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 11:22:57 +0100
Subject: [PATCH 044/131] build: Only run OSS Index audit on runtime
 dependencies, not tests

New issues with WireMocks dep on Jetty BOM ~v9
---
 pom.xml | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/pom.xml b/pom.xml
index 3f086bc94..9142b4fd1 100644
--- a/pom.xml
+++ b/pom.xml
@@ -500,6 +500,9 @@
                         </goals>
                     </execution>
                 </executions>
+                <configuration>
+                    <scope>runtime</scope>
+                </configuration>
             </plugin>
             <plugin>
                 <groupId>com.soebes.maven.plugins</groupId>

From 10ac83ac485d03a7b5f803fe41d5005b63c996a9 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 11:22:57 +0100
Subject: [PATCH 045/131] build: Only run OSS Index audit on runtime
 dependencies, not tests

New issues with WireMocks dep on Jetty BOM ~v9
---
 pom.xml | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/pom.xml b/pom.xml
index 21a01eb96..21c6f1895 100644
--- a/pom.xml
+++ b/pom.xml
@@ -512,6 +512,9 @@
                         </goals>
                     </execution>
                 </executions>
+                <configuration>
+                    <scope>runtime</scope>
+                </configuration>
             </plugin>
             <plugin>
                 <groupId>com.soebes.maven.plugins</groupId>

From 7efc8de4c5da39a2429d2a2fad2acf16462cefd3 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 12:15:31 +0100
Subject: [PATCH 046/131] build: Don't fail for OSSIndex scan - will set up
 another CI job for that

Especially given we also use dependabot. If anyone is concerned to that level, they can use the plugin in their end user applications.
---
 pom.xml | 1 +
 1 file changed, 1 insertion(+)

diff --git a/pom.xml b/pom.xml
index 9142b4fd1..58a1ba731 100644
--- a/pom.xml
+++ b/pom.xml
@@ -502,6 +502,7 @@
                 </executions>
                 <configuration>
                     <scope>runtime</scope>
+                    <fail>false</fail>
                 </configuration>
             </plugin>
             <plugin>

From 70a37cd8030a95b9ff5882df8e7982f4e94f680a Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 12:15:31 +0100
Subject: [PATCH 047/131] build: Don't fail for OSSIndex scan - will set up
 another CI job for that

Especially given we also use dependabot. If anyone is concerned to that level, they can use the plugin in their end user applications.
---
 pom.xml | 1 +
 1 file changed, 1 insertion(+)

diff --git a/pom.xml b/pom.xml
index 21c6f1895..0c0b15f24 100644
--- a/pom.xml
+++ b/pom.xml
@@ -514,6 +514,7 @@
                 </executions>
                 <configuration>
                     <scope>runtime</scope>
+                    <fail>false</fail>
                 </configuration>
             </plugin>
             <plugin>

From f2ec1dd9a0b9d7834dd4c67f002d34cd1f84c182 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 12:19:37 +0100
Subject: [PATCH 048/131] fix cherry-pick

---
 pom.xml | 6 ++----
 1 file changed, 2 insertions(+), 4 deletions(-)

diff --git a/pom.xml b/pom.xml
index 0c0b15f24..b712b7713 100644
--- a/pom.xml
+++ b/pom.xml
@@ -492,6 +492,8 @@
                 <artifactId>ossindex-maven-plugin</artifactId>
                 <version>3.2.0</version>
                 <configuration>
+                    <scope>runtime</scope>
+                    <fail>false</fail>
                     <excludeCoordinates>
                         <exclude>
                             <!-- https://github.com/google/guava/issues/4011 -->
@@ -512,10 +514,6 @@
                         </goals>
                     </execution>
                 </executions>
-                <configuration>
-                    <scope>runtime</scope>
-                    <fail>false</fail>
-                </configuration>
             </plugin>
             <plugin>
                 <groupId>com.soebes.maven.plugins</groupId>

From 223e087d91f4f7faccfe0e99927dfa9c27d2a90f Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 12:25:28 +0100
Subject: [PATCH 049/131] Revert "allow truth snapshot"

This reverts commit 23e5389c17794510b68731b3b7d9786820eacad8.
---
 pom.xml | 1 -
 1 file changed, 1 deletion(-)

diff --git a/pom.xml b/pom.xml
index 7cb7c507f..f01414f2d 100644
--- a/pom.xml
+++ b/pom.xml
@@ -739,7 +739,6 @@
                                     <onlyWhenRelease>false</onlyWhenRelease>
                                     <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>
                                     <excludes>
-                                        <exclude>io.stubbs.truth:</exclude>
                                         <exclude>io.confluent.parallelconsumer:</exclude>
                                     </excludes>
                                 </requireReleaseDeps>

From 0d2b370212b498c80b60262463b88cb78c93ea39 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 12:28:51 +0100
Subject: [PATCH 050/131] build: Only enforce requireReleaseDeps when running
 in CI, not locally

---
 pom.xml | 36 +++++++++++++++++++++++++++++-------
 1 file changed, 29 insertions(+), 7 deletions(-)

diff --git a/pom.xml b/pom.xml
index b712b7713..e72e6c1a3 100644
--- a/pom.xml
+++ b/pom.xml
@@ -189,6 +189,35 @@
                 <license.mode>check</license.mode>
                 <parallel-tests>false</parallel-tests>
             </properties>
+            <build>
+                <plugins>
+                    <plugin>
+                        <groupId>org.apache.maven.plugins</groupId>
+                        <artifactId>maven-enforcer-plugin</artifactId>
+                        <executions>
+                            <execution>
+                                <id>enforce-versions</id>
+                                <goals>
+                                    <goal>enforce</goal>
+                                </goals>
+                                <phase>validate</phase>
+                                <configuration>
+                                    <rules>
+                                        <!-- only enforce requireReleaseDeps when running in CI, not locally -->
+                                        <requireReleaseDeps>
+                                            <onlyWhenRelease>false</onlyWhenRelease>
+                                            <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>
+                                            <excludes>
+                                                <exclude>io.confluent.parallelconsumer:</exclude>
+                                            </excludes>
+                                        </requireReleaseDeps>
+                                    </rules>
+                                </configuration>
+                            </execution>
+                        </executions>
+                    </plugin>
+                </plugins>
+            </build>
         </profile>
         <profile>
             <id>maven-central</id>
@@ -734,13 +763,6 @@
                                 <reactorModuleConvergence />
                                 <banDuplicatePomDependencyVersions />
                                 <requireSameVersions />
-                                <requireReleaseDeps>
-                                    <onlyWhenRelease>false</onlyWhenRelease>
-                                    <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>
-                                    <excludes>
-                                        <exclude>io.confluent.parallelconsumer:</exclude>
-                                    </excludes>
-                                </requireReleaseDeps>
                             </rules>
                         </configuration>
                     </execution>

From 9f184701a9aa09be3d06fa0d9d49302b563a9a46 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 14:44:18 +0100
Subject: [PATCH 051/131] stale test?

---
 .../io/confluent/parallelconsumer/state/ShardKeyTest.java    | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
index 2bf017487..748cd9b43 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
@@ -65,8 +65,9 @@ void keyTest() {
         var reck4 = new ConsumerRecord<>(topicOne, 1, 0, keyOne, "v");
         ShardKey of4 = ShardKey.of(reck2, ordering);
         assertThat(key1).isNotEqualTo(of3);
-        // check both exist in queue too
-        assertThat("false").isEmpty();
+
+        // check both exist in queue too ??
+        //assertThat("false").isEmpty();
     }
 
 }

From f3e73ea024bdde93c44bef33b5cb5f2ca0602c5f Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 9 Jul 2022 14:44:49 +0100
Subject: [PATCH 052/131] ConsumerSubject blocked by PC no multi threaded
 access

java.util.ConcurrentModificationException: KafkaConsumer is not safe for multi-threaded access
---
 .../parallelconsumer/integrationTests/MultiTopicTest.java   | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index 810fc6fbf..4751cf153 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -52,7 +52,10 @@ void multiTopic(ProcessingOrder order) {
 
         // commits
 //        pc.closeWithoutClosingClients();
-        pc.close();
+//        pc.close();
+        pc.requestCommitAsap();
+
+        //
         await().atMost(Duration.ofSeconds(1)).untilAsserted(() -> {
             multiTopics.forEach(singleTopic -> assertCommit(pc, singleTopic, recordsPerTopic + 1));
         });
@@ -66,6 +69,7 @@ private void sendMessages(NewTopic newTopic, int recordsPerTopic) {
 
     private void assertCommit(final ParallelEoSStreamProcessor<String, String> pc, NewTopic newTopic, int recordsPerTopic) {
         var committer = getKcu().getLastConsumerConstructed();
+
         assertThat(committer)
                 .hasCommittedToPartition(newTopic)
                 .offset(recordsPerTopic);

From 00c581addb46aa3bd701551497087165884a7f5d Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 30 Jun 2022 12:28:58 +0300
Subject: [PATCH 053/131] TEMPORARY: use TG 0.1.1 snapshot

---
 pom.xml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pom.xml b/pom.xml
index f0ed2a681..530e94519 100644
--- a/pom.xml
+++ b/pom.xml
@@ -112,7 +112,7 @@
         <truth.version>1.1.3</truth.version>
         <flogger.version>0.7.4</flogger.version>
         <mockito.version>4.5.1</mockito.version>
-        <truth-generator-maven-plugin.version>0.1</truth-generator-maven-plugin.version>
+        <truth-generator-maven-plugin.version>0.1.1-SNAPSHOT</truth-generator-maven-plugin.version>
         <jabel.version>0.4.2</jabel.version>
     </properties>
 

From 4f2de5c7bf010ca77bfa9244ed20bb79b77a7a24 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 11:16:52 +0100
Subject: [PATCH 054/131] remove guava exclude from branch

---
 pom.xml | 10 ----------
 1 file changed, 10 deletions(-)

diff --git a/pom.xml b/pom.xml
index e72e6c1a3..c4ae219f3 100644
--- a/pom.xml
+++ b/pom.xml
@@ -523,16 +523,6 @@
                 <configuration>
                     <scope>runtime</scope>
                     <fail>false</fail>
-                    <excludeCoordinates>
-                        <exclude>
-                            <!-- https://github.com/google/guava/issues/4011 -->
-                            <!-- CVE-2020-8908: Files::createTempDir local information disclosure vulnerability #4011 -->
-                            <!-- only used transitively from tests, and is a deprecated function -->
-                            <groupId>com.google.guava</groupId>
-                            <artifactId>guava</artifactId>
-                            <version>31.1-jre</version>
-                        </exclude>
-                    </excludeCoordinates>
                 </configuration>
                 <executions>
                     <execution>

From ad5092cc726d35c6c72abcd5c6af351568949438 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 11:18:20 +0100
Subject: [PATCH 055/131] cleanse branch

---
 pom.xml | 4 ----
 1 file changed, 4 deletions(-)

diff --git a/pom.xml b/pom.xml
index c4ae219f3..251c17b70 100644
--- a/pom.xml
+++ b/pom.xml
@@ -520,10 +520,6 @@
                 <groupId>org.sonatype.ossindex.maven</groupId>
                 <artifactId>ossindex-maven-plugin</artifactId>
                 <version>3.2.0</version>
-                <configuration>
-                    <scope>runtime</scope>
-                    <fail>false</fail>
-                </configuration>
                 <executions>
                     <execution>
                         <id>audit-dependencies</id>

From 5e0db167bb09e22f260955c1cfbb280c8dedb63b Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 11:24:40 +0100
Subject: [PATCH 056/131] test snapshot first

---
 pom.xml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pom.xml b/pom.xml
index a4099e98f..deb1502fe 100644
--- a/pom.xml
+++ b/pom.xml
@@ -112,7 +112,7 @@
         <truth.version>1.1.3</truth.version>
         <flogger.version>0.7.4</flogger.version>
         <mockito.version>4.5.1</mockito.version>
-        <truth-generator-maven-plugin.version>0.1.1</truth-generator-maven-plugin.version>
+        <truth-generator-maven-plugin.version>0.1.1-SNAPSHOT</truth-generator-maven-plugin.version>
         <jabel.version>0.4.2</jabel.version>
     </properties>
 

From ac65300b912b40e3b69bcfcb88496cef07d7c588 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 11:42:18 +0100
Subject: [PATCH 057/131] test snapshot first

---
 pom.xml | 51 ++++++++++++++++++++++++++-------------------------
 1 file changed, 26 insertions(+), 25 deletions(-)

diff --git a/pom.xml b/pom.xml
index deb1502fe..69a597a85 100644
--- a/pom.xml
+++ b/pom.xml
@@ -191,31 +191,32 @@
             </properties>
             <build>
                 <plugins>
-                    <plugin>
-                        <groupId>org.apache.maven.plugins</groupId>
-                        <artifactId>maven-enforcer-plugin</artifactId>
-                        <executions>
-                            <execution>
-                                <id>enforce-versions</id>
-                                <goals>
-                                    <goal>enforce</goal>
-                                </goals>
-                                <phase>validate</phase>
-                                <configuration>
-                                    <rules>
-                                        <!-- only enforce requireReleaseDeps when running in CI, not locally -->
-                                        <requireReleaseDeps>
-                                            <onlyWhenRelease>false</onlyWhenRelease>
-                                            <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>
-                                            <excludes>
-                                                <exclude>io.confluent.parallelconsumer:</exclude>
-                                            </excludes>
-                                        </requireReleaseDeps>
-                                    </rules>
-                                </configuration>
-                            </execution>
-                        </executions>
-                    </plugin>
+                    <!-- make jenkins test TG snapshot -->
+                    <!--                    <plugin>-->
+                    <!--                        <groupId>org.apache.maven.plugins</groupId>-->
+                    <!--                        <artifactId>maven-enforcer-plugin</artifactId>-->
+                    <!--                        <executions>-->
+                    <!--                            <execution>-->
+                    <!--                                <id>enforce-versions</id>-->
+                    <!--                                <goals>-->
+                    <!--                                    <goal>enforce</goal>-->
+                    <!--                                </goals>-->
+                    <!--                                <phase>validate</phase>-->
+                    <!--                                <configuration>-->
+                    <!--                                    <rules>-->
+                    <!--                                        &lt;!&ndash; only enforce requireReleaseDeps when running in CI, not locally &ndash;&gt;-->
+                    <!--                                        <requireReleaseDeps>-->
+                    <!--                                            <onlyWhenRelease>false</onlyWhenRelease>-->
+                    <!--                                            <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>-->
+                    <!--                                            <excludes>-->
+                    <!--                                                <exclude>io.confluent.parallelconsumer:</exclude>-->
+                    <!--                                            </excludes>-->
+                    <!--                                        </requireReleaseDeps>-->
+                    <!--                                    </rules>-->
+                    <!--                                </configuration>-->
+                    <!--                            </execution>-->
+                    <!--                        </executions>-->
+                    <!--                    </plugin>-->
                 </plugins>
             </build>
         </profile>

From ab5a528257a8f2dc42afa711e61881b664d7e305 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 16:39:46 +0100
Subject: [PATCH 058/131] test mutli topic with simply creating a new consumer
 and checking assignment

---
 .../integrationTests/MultiTopicTest.java      | 32 +++++++++++++++++--
 1 file changed, 29 insertions(+), 3 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index 4751cf153..db0b35e5b 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -9,13 +9,19 @@
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.NewTopic;
+import org.apache.kafka.clients.consumer.Consumer;
+import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import org.apache.kafka.common.TopicPartition;
 import org.hamcrest.Matchers;
 import org.junit.jupiter.params.ParameterizedTest;
 import org.junit.jupiter.params.provider.EnumSource;
 
 import java.time.Duration;
 import java.util.List;
+import java.util.Map;
+import java.util.Set;
 import java.util.concurrent.atomic.AtomicInteger;
+import java.util.stream.Collectors;
 
 import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
 import static one.util.streamex.StreamEx.of;
@@ -54,13 +60,33 @@ void multiTopic(ProcessingOrder order) {
 //        pc.closeWithoutClosingClients();
 //        pc.close();
         pc.requestCommitAsap();
+        log.info("commit msg sent");
+        pc.close();
 
         //
-        await().atMost(Duration.ofSeconds(1)).untilAsserted(() -> {
-            multiTopics.forEach(singleTopic -> assertCommit(pc, singleTopic, recordsPerTopic + 1));
-        });
+        Consumer<?, ?> assertingConsumer = kcu.createNewConsumer(false);
+        await().atMost(Duration.ofSeconds(10))
+//                .failFast(pc::isClosedOrFailed)
+                .untilAsserted(() -> {
+                    assertSeparateConsumerCommit(assertingConsumer, new HashSet<>(multiTopics), recordsPerTopic);
+//                    assertCommit(pc, new HashSet<>(multiTopics), recordsPerTopic);
+//                    multiTopics.forEach(singleTopic -> assertCommit(pc, singleTopic, recordsPerTopic));
+                });
+        log.info("Offsets committed");
     }
 
+    /**
+     * Can't get committed offsets from PC wrapped consumer, so force commit by closing PC, then create new consumer
+     * with same group id, and assert what offsets are told are committed.
+     * <p>
+     * When consumer-interface #XXX is merged, could just poll PC directly (see commented out assertCommit below).
+     */
+    private void assertSeparateConsumerCommit(Consumer<?, ?> assertingConsumer, HashSet<NewTopic> topics, int expectedOffset) {
+        Set<TopicPartition> partitions = topics.stream().map(newTopic -> new TopicPartition(newTopic.name(), 0)).collect(Collectors.toSet());
+        Map<TopicPartition, OffsetAndMetadata> committed = assertingConsumer.committed(partitions);
+        var partitionSubjects = assertThat(assertingConsumer).hasCommittedToPartition(topics);
+        partitionSubjects.forEach((topicPartition, commitHistorySubject) -> commitHistorySubject.atLeastOffset(expectedOffset));
+    }
 
     @SneakyThrows
     private void sendMessages(NewTopic newTopic, int recordsPerTopic) {

From 186144db4af220d0df967e15fa093a62ab950ca3 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 12:35:31 +0100
Subject: [PATCH 059/131] update after rename

---
 .../parallelconsumer/truth/CommitHistorySubject.java          | 4 ++--
 .../io/confluent/parallelconsumer/truth/ConsumerSubject.java  | 4 ++--
 .../truth/LongPollingMockConsumerSubject.java                 | 4 ++--
 3 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
index 6bd171c26..cf8699001 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
@@ -9,7 +9,7 @@
 import com.google.common.truth.Subject;
 import io.confluent.parallelconsumer.model.CommitHistory;
 import io.stubbs.truth.generator.SubjectFactoryMethod;
-import io.stubbs.truth.generator.UserManagedTruth;
+import io.stubbs.truth.generator.UserManagedSubject;
 
 import java.util.Optional;
 
@@ -18,7 +18,7 @@
 /**
  * @see CommitHistory
  */
-@UserManagedTruth(CommitHistory.class)
+@UserManagedSubject(CommitHistory.class)
 public class CommitHistorySubject extends Subject {
     private final CommitHistory actual;
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
index 8daf5b826..7f70d955a 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -7,7 +7,7 @@
 import com.google.common.truth.FailureMetadata;
 import io.confluent.parallelconsumer.model.CommitHistory;
 import io.stubbs.truth.generator.SubjectFactoryMethod;
-import io.stubbs.truth.generator.UserManagedTruth;
+import io.stubbs.truth.generator.UserManagedSubject;
 import org.apache.kafka.clients.admin.NewTopic;
 import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerParentSubject;
@@ -32,7 +32,7 @@
  * @see Consumer
  * @see ConsumerParentSubject
  */
-@UserManagedTruth(Consumer.class)
+@UserManagedSubject(Consumer.class)
 @Generated(value = "io.stubbs.truth.generator.internal.TruthGenerator", date = "2022-05-17T12:20:38.207945Z")
 public class ConsumerSubject extends ConsumerParentSubject {
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
index 07230dda9..d0dcadc89 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
@@ -9,7 +9,7 @@
 import io.confluent.csid.utils.LongPollingMockConsumer;
 import io.confluent.parallelconsumer.model.CommitHistory;
 import io.stubbs.truth.generator.SubjectFactoryMethod;
-import io.stubbs.truth.generator.UserManagedTruth;
+import io.stubbs.truth.generator.UserManagedSubject;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 
@@ -21,7 +21,7 @@
 import static com.google.common.truth.Truth.assertAbout;
 import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
 
-@UserManagedTruth(LongPollingMockConsumer.class)
+@UserManagedSubject(LongPollingMockConsumer.class)
 public class LongPollingMockConsumerSubject<K, V> extends Subject {
 
     private final LongPollingMockConsumer<K, V> actual;

From 38bf42e8426b8655dd1f4b0def7ae5a344b293f2 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 17:58:18 +0100
Subject: [PATCH 060/131] fixup! test mutli topic with simply creating a new
 consumer and checking assignment

---
 .../integrationTests/MultiTopicTest.java      | 29 ++++++--------
 .../truth/ConsumerSubject.java                | 38 ++++++++++---------
 2 files changed, 33 insertions(+), 34 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index db0b35e5b..d5605b8ea 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -1,11 +1,10 @@
+package io.confluent.parallelconsumer.integrationTests;
 
 /*-
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
-package io.confluent.parallelconsumer.integrationTests;
 
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
-import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.NewTopic;
@@ -17,6 +16,7 @@
 import org.junit.jupiter.params.provider.EnumSource;
 
 import java.time.Duration;
+import java.util.HashSet;
 import java.util.List;
 import java.util.Map;
 import java.util.Set;
@@ -57,22 +57,15 @@ void multiTopic(ProcessingOrder order) {
         await().untilAtomic(messageProcessedCount, Matchers.is(equalTo(expectedMessagesCount)));
 
         // commits
-//        pc.closeWithoutClosingClients();
-//        pc.close();
         pc.requestCommitAsap();
-        log.info("commit msg sent");
         pc.close();
 
         //
         Consumer<?, ?> assertingConsumer = kcu.createNewConsumer(false);
         await().atMost(Duration.ofSeconds(10))
-//                .failFast(pc::isClosedOrFailed)
                 .untilAsserted(() -> {
                     assertSeparateConsumerCommit(assertingConsumer, new HashSet<>(multiTopics), recordsPerTopic);
-//                    assertCommit(pc, new HashSet<>(multiTopics), recordsPerTopic);
-//                    multiTopics.forEach(singleTopic -> assertCommit(pc, singleTopic, recordsPerTopic));
                 });
-        log.info("Offsets committed");
     }
 
     /**
@@ -85,7 +78,8 @@ private void assertSeparateConsumerCommit(Consumer<?, ?> assertingConsumer, Hash
         Set<TopicPartition> partitions = topics.stream().map(newTopic -> new TopicPartition(newTopic.name(), 0)).collect(Collectors.toSet());
         Map<TopicPartition, OffsetAndMetadata> committed = assertingConsumer.committed(partitions);
         var partitionSubjects = assertThat(assertingConsumer).hasCommittedToPartition(topics);
-        partitionSubjects.forEach((topicPartition, commitHistorySubject) -> commitHistorySubject.atLeastOffset(expectedOffset));
+        partitionSubjects.forEach((topicPartition, commitHistorySubject)
+                -> commitHistorySubject.atLeastOffset(expectedOffset));
     }
 
     @SneakyThrows
@@ -93,12 +87,13 @@ private void sendMessages(NewTopic newTopic, int recordsPerTopic) {
         getKcu().produceMessages(newTopic.name(), recordsPerTopic);
     }
 
-    private void assertCommit(final ParallelEoSStreamProcessor<String, String> pc, NewTopic newTopic, int recordsPerTopic) {
-        var committer = getKcu().getLastConsumerConstructed();
-
-        assertThat(committer)
-                .hasCommittedToPartition(newTopic)
-                .offset(recordsPerTopic);
-    }
+// depends on merge of features/consumer-interface branch
+//    private void assertCommit(final ParallelEoSStreamProcessor<String, String> pc, NewTopic newTopic, int recordsPerTopic) {
+//        var committer = getKcu().getLastConsumerConstructed();
+//
+//        assertThat(committer)
+//                .hasCommittedToPartition(newTopic)
+//                .offset(recordsPerTopic);
+//    }
 
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
index 7f70d955a..08cbe38bf 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -8,23 +8,24 @@
 import io.confluent.parallelconsumer.model.CommitHistory;
 import io.stubbs.truth.generator.SubjectFactoryMethod;
 import io.stubbs.truth.generator.UserManagedSubject;
+import one.util.streamex.StreamEx;
 import org.apache.kafka.clients.admin.NewTopic;
 import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerParentSubject;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
-import pl.tlinkowski.unij.api.UniLists;
-import pl.tlinkowski.unij.api.UniSets;
 
 import javax.annotation.Generated;
 import java.time.Duration;
+import java.util.List;
 import java.util.Map;
+import java.util.Set;
+import java.util.stream.Collectors;
 
 import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
 
 /**
  * Optionally move this class into source control, and add your custom assertions here.
- *
  * <p>
  * If the system detects this class already exists, it won't attempt to generate a new one. Note that if the base
  * skeleton of this class ever changes, you won't automatically get it updated.
@@ -51,21 +52,24 @@ public static Factory<ConsumerSubject, Consumer> consumers() {
     private final Duration timeout = Duration.ofSeconds(10);
 
     public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
-        int defaultPartition = 0;
-        TopicPartition tp = new TopicPartition(topic.name(), defaultPartition);
-        var committed = (Map<TopicPartition, OffsetAndMetadata>) actual.committed(UniSets.of(tp), timeout);
-        OffsetAndMetadata offsets = committed.get(tp);
-        CommitHistory commitHistory = new CommitHistory(UniLists.of(offsets));
-        return check("getCommitHistory(%s)", topic).about(commitHistories()).that(commitHistory);
+        Map<TopicPartition, CommitHistorySubject> map = hasCommittedToPartition(Set.of(topic));
+        return map.values().stream()
+                .findFirst()
+                .orElse(
+                        check("getCommitHistory(%s)", topic.name())
+                                .about(commitHistories())
+                                .that(new CommitHistory(List.of())));
     }
 
-//    @Override
-//    protected String actualCustomStringRepresentation() {
-//        String assignors = ReflectionToStringBuilder.toStringExclude(actual,
-//                "assignors", "client", "time", "kafkaConsumerMetrics", "coordinator", "log", "metrics", "fetcher",
-//                "keyDeserializer", "valueDeserializer", "interceptors", "cachedSubscriptionHashAllFetchPositions", "metadata"
-//        );
-//        return assignors;
-//    }
+    public Map<TopicPartition, CommitHistorySubject> hasCommittedToPartition(Set<NewTopic> topic) {
+        Set<TopicPartition> partitions = topic.stream().map(newTopic -> new TopicPartition(newTopic.name(), 0)).collect(Collectors.toSet());
+        Map<TopicPartition, OffsetAndMetadata> committed = actual.committed(partitions, timeout);
+        return StreamEx.of(committed.entrySet())
+                .filter(entry -> entry.getValue() != null)
+                .toMap(entry -> entry.getKey(), entry
+                        -> check("getCommitHistory(%s)", entry.getKey().topic() + ":" + entry.getKey().partition())
+                        .about(commitHistories())
+                        .that(new CommitHistory(List.of(entry.getValue()))));
+    }
 
 }

From bb61774ca0ca341bc2d2fd45ea08925161441b52 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 18:40:18 +0100
Subject: [PATCH 061/131] fixup! test mutli topic with simply creating a new
 consumer and checking assignment

---
 .../parallelconsumer/truth/ConsumerSubject.java          | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
index 08cbe38bf..c53f25c6d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -14,10 +14,11 @@
 import org.apache.kafka.clients.consumer.ConsumerParentSubject;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
+import pl.tlinkowski.unij.api.UniLists;
+import pl.tlinkowski.unij.api.UniSets;
 
 import javax.annotation.Generated;
 import java.time.Duration;
-import java.util.List;
 import java.util.Map;
 import java.util.Set;
 import java.util.stream.Collectors;
@@ -52,13 +53,13 @@ public static Factory<ConsumerSubject, Consumer> consumers() {
     private final Duration timeout = Duration.ofSeconds(10);
 
     public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
-        Map<TopicPartition, CommitHistorySubject> map = hasCommittedToPartition(Set.of(topic));
+        Map<TopicPartition, CommitHistorySubject> map = hasCommittedToPartition(UniSets.of(topic));
         return map.values().stream()
                 .findFirst()
                 .orElse(
                         check("getCommitHistory(%s)", topic.name())
                                 .about(commitHistories())
-                                .that(new CommitHistory(List.of())));
+                                .that(new CommitHistory(UniLists.of())));
     }
 
     public Map<TopicPartition, CommitHistorySubject> hasCommittedToPartition(Set<NewTopic> topic) {
@@ -69,7 +70,7 @@ public Map<TopicPartition, CommitHistorySubject> hasCommittedToPartition(Set<New
                 .toMap(entry -> entry.getKey(), entry
                         -> check("getCommitHistory(%s)", entry.getKey().topic() + ":" + entry.getKey().partition())
                         .about(commitHistories())
-                        .that(new CommitHistory(List.of(entry.getValue()))));
+                        .that(new CommitHistory(UniLists.of(entry.getValue()))));
     }
 
 }

From 914dc590ecba7b7dcf7e5da5b9e8e625ad29ef63 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 19:42:15 +0100
Subject: [PATCH 062/131] switch from NewTopic to TopicPartitions

---
 .../integrationTests/MultiTopicTest.java              |  2 +-
 .../integrationTests/utils/KafkaClientUtils.java      |  1 +
 .../parallelconsumer/truth/ConsumerSubject.java       | 11 ++++-------
 3 files changed, 6 insertions(+), 8 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index d5605b8ea..db788825e 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -77,7 +77,7 @@ void multiTopic(ProcessingOrder order) {
     private void assertSeparateConsumerCommit(Consumer<?, ?> assertingConsumer, HashSet<NewTopic> topics, int expectedOffset) {
         Set<TopicPartition> partitions = topics.stream().map(newTopic -> new TopicPartition(newTopic.name(), 0)).collect(Collectors.toSet());
         Map<TopicPartition, OffsetAndMetadata> committed = assertingConsumer.committed(partitions);
-        var partitionSubjects = assertThat(assertingConsumer).hasCommittedToPartition(topics);
+        var partitionSubjects = assertThat(assertingConsumer).hasCommittedToPartition(partitions);
         partitionSubjects.forEach((topicPartition, commitHistorySubject)
                 -> commitHistorySubject.atLeastOffset(expectedOffset));
     }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index d1635dfed..8b07b696f 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -1,4 +1,5 @@
 package io.confluent.parallelconsumer.integrationTests.utils;
+
 /*-
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
index c53f25c6d..08773db5d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -9,7 +9,6 @@
 import io.stubbs.truth.generator.SubjectFactoryMethod;
 import io.stubbs.truth.generator.UserManagedSubject;
 import one.util.streamex.StreamEx;
-import org.apache.kafka.clients.admin.NewTopic;
 import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerParentSubject;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
@@ -21,7 +20,6 @@
 import java.time.Duration;
 import java.util.Map;
 import java.util.Set;
-import java.util.stream.Collectors;
 
 import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
 
@@ -52,18 +50,17 @@ public static Factory<ConsumerSubject, Consumer> consumers() {
 
     private final Duration timeout = Duration.ofSeconds(10);
 
-    public CommitHistorySubject hasCommittedToPartition(NewTopic topic) {
-        Map<TopicPartition, CommitHistorySubject> map = hasCommittedToPartition(UniSets.of(topic));
+    public CommitHistorySubject hasCommittedToPartition(TopicPartition topicPartitions) {
+        Map<TopicPartition, CommitHistorySubject> map = hasCommittedToPartition(UniSets.of(topicPartitions));
         return map.values().stream()
                 .findFirst()
                 .orElse(
-                        check("getCommitHistory(%s)", topic.name())
+                        check("getCommitHistory(%s)", topicPartitions.topic())
                                 .about(commitHistories())
                                 .that(new CommitHistory(UniLists.of())));
     }
 
-    public Map<TopicPartition, CommitHistorySubject> hasCommittedToPartition(Set<NewTopic> topic) {
-        Set<TopicPartition> partitions = topic.stream().map(newTopic -> new TopicPartition(newTopic.name(), 0)).collect(Collectors.toSet());
+    public Map<TopicPartition, CommitHistorySubject> hasCommittedToPartition(Set<TopicPartition> partitions) {
         Map<TopicPartition, OffsetAndMetadata> committed = actual.committed(partitions, timeout);
         return StreamEx.of(committed.entrySet())
                 .filter(entry -> entry.getValue() != null)

From 75287fa0a649a2a3dc23bcb2281bbd067ee9d8dd Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 20:11:29 +0100
Subject: [PATCH 063/131] ide: Add All test run target

Runs all tests in all modules using pattern search.
https://stackoverflow.com/questions/11469122/run-unit-tests-in-intellij-idea-from-multiple-modules-together
---
 .idea/runConfigurations/All.xml | 22 ++++++++++++++--------
 1 file changed, 14 insertions(+), 8 deletions(-)

diff --git a/.idea/runConfigurations/All.xml b/.idea/runConfigurations/All.xml
index a93cde1bb..ea05c3101 100644
--- a/.idea/runConfigurations/All.xml
+++ b/.idea/runConfigurations/All.xml
@@ -1,20 +1,26 @@
 <component name="ProjectRunConfigurationManager">
-  <configuration default="false" name="All" type="JUnit" factoryName="JUnit" singleton="false">
-    <useClassPathOnly />
-    <option name="PACKAGE_NAME" value="io.confluent" />
+  <configuration default="false" name="All" type="JUnit" factoryName="JUnit">
+    <extension name="net.ashald.envfile">
+      <option name="IS_ENABLED" value="false" />
+      <option name="IS_SUBST" value="false" />
+      <option name="IS_PATH_MACRO_SUPPORTED" value="false" />
+      <option name="IS_IGNORE_MISSING_FILES" value="false" />
+      <option name="IS_ENABLE_EXPERIMENTAL_INTEGRATIONS" value="false" />
+      <ENTRIES>
+        <ENTRY IS_ENABLED="true" PARSER="runconfig" />
+      </ENTRIES>
+    </extension>
     <option name="MAIN_CLASS_NAME" value="" />
     <option name="METHOD_NAME" value="" />
-    <option name="TEST_OBJECT" value="package" />
-    <option name="PARAMETERS" value="" />
+    <option name="TEST_OBJECT" value="pattern" />
     <option name="TEST_SEARCH_SCOPE">
       <value defaultName="wholeProject" />
     </option>
-    <dir value="$PROJECT_DIR$" />
     <patterns>
-      <pattern testClass="*" />
+      <pattern testClass=".*" />
     </patterns>
     <method v="2">
       <option name="Make" enabled="true" />
     </method>
   </configuration>
-</component>
+</component>
\ No newline at end of file

From a9992421d2b05f114ff548d4f9ca37d6513edf0b Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 23:02:45 +0100
Subject: [PATCH 064/131] review

---
 .../AbstractParallelEoSStreamProcessor.java   |  5 --
 .../internal/BrokerPollSystem.java            |  1 -
 .../truth/CommitHistorySubject.java           |  7 +-
 pom.xml                                       | 67 +++++++++----------
 4 files changed, 34 insertions(+), 46 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
index 2aafe77e7..5f186fb93 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
@@ -41,7 +41,6 @@
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.internal.State.*;
 import static java.time.Duration.ofMillis;
-import static java.time.Duration.ofSeconds;
 import static java.util.concurrent.TimeUnit.MILLISECONDS;
 import static java.util.concurrent.TimeUnit.SECONDS;
 import static lombok.AccessLevel.PRIVATE;
@@ -107,10 +106,6 @@ public abstract class AbstractParallelEoSStreamProcessor<K, V> implements Parall
     @Getter(PROTECTED)
     private final BlockingQueue<ControllerEventMessage<K, V>> workMailBox = new LinkedBlockingQueue<>(); // Thread safe, highly performant, non blocking
 
-    public void closeWithoutClosingClients() {
-        close(ofSeconds(30), DrainingMode.DRAIN);
-    }
-
     /**
      * An inbound message to the controller.
      * <p>
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java
index ada42a953..b94151b9f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/BrokerPollSystem.java
@@ -162,7 +162,6 @@ private void doClose() {
     private void maybeCloseConsumerManager() {
         if (isResponsibleForCommits()) {
             log.debug("Closing {}, first closing consumer...", this.getClass().getSimpleName());
-// remove to keep consumer open
             this.consumerManager.close(DrainingCloseable.DEFAULT_TIMEOUT);
             log.debug("Consumer closed.");
         }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
index cf8699001..cca1e5853 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
@@ -65,10 +65,5 @@ public void nothing() {
     public void isEmpty() {
         nothing();
     }
-//
-//    @Override
-//    protected String actualCustomStringRepresentation() {
-////        String s = actual.;
-//        return super.actualCustomStringRepresentation();
-//    }
+
 }
diff --git a/pom.xml b/pom.xml
index d056f2144..b48611076 100644
--- a/pom.xml
+++ b/pom.xml
@@ -191,32 +191,31 @@
             </properties>
             <build>
                 <plugins>
-                    <!-- make jenkins test TG snapshot -->
-                    <!--                    <plugin>-->
-                    <!--                        <groupId>org.apache.maven.plugins</groupId>-->
-                    <!--                        <artifactId>maven-enforcer-plugin</artifactId>-->
-                    <!--                        <executions>-->
-                    <!--                            <execution>-->
-                    <!--                                <id>enforce-versions</id>-->
-                    <!--                                <goals>-->
-                    <!--                                    <goal>enforce</goal>-->
-                    <!--                                </goals>-->
-                    <!--                                <phase>validate</phase>-->
-                    <!--                                <configuration>-->
-                    <!--                                    <rules>-->
-                    <!--                                        &lt;!&ndash; only enforce requireReleaseDeps when running in CI, not locally &ndash;&gt;-->
-                    <!--                                        <requireReleaseDeps>-->
-                    <!--                                            <onlyWhenRelease>false</onlyWhenRelease>-->
-                    <!--                                            <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>-->
-                    <!--                                            <excludes>-->
-                    <!--                                                <exclude>io.confluent.parallelconsumer:</exclude>-->
-                    <!--                                            </excludes>-->
-                    <!--                                        </requireReleaseDeps>-->
-                    <!--                                    </rules>-->
-                    <!--                                </configuration>-->
-                    <!--                            </execution>-->
-                    <!--                        </executions>-->
-                    <!--                    </plugin>-->
+                    <plugin>
+                        <groupId>org.apache.maven.plugins</groupId>
+                        <artifactId>maven-enforcer-plugin</artifactId>
+                        <executions>
+                            <execution>
+                                <id>enforce-versions</id>
+                                <goals>
+                                    <goal>enforce</goal>
+                                </goals>
+                                <phase>validate</phase>
+                                <configuration>
+                                    <rules>
+                                        <!-- only enforce requireReleaseDeps when running in CI, not locally -->
+                                        <requireReleaseDeps>
+                                            <onlyWhenRelease>false</onlyWhenRelease>
+                                            <failWhenParentIsSnapshot>false</failWhenParentIsSnapshot>
+                                            <excludes>
+                                                <exclude>io.confluent.parallelconsumer:</exclude>
+                                            </excludes>
+                                        </requireReleaseDeps>
+                                    </rules>
+                                </configuration>
+                            </execution>
+                        </executions>
+                    </plugin>
                 </plugins>
             </build>
         </profile>
@@ -837,14 +836,14 @@
                     <outputDirectory>${delombok.output}</outputDirectory>
                     <addOutputDirectory>false</addOutputDirectory>
                 </configuration>
-                <!--                <executions>-->
-                <!--                    <execution>-->
-                <!--                        <phase>generate-sources</phase>-->
-                <!--                        <goals>-->
-                <!--                            <goal>delombok</goal>-->
-                <!--                        </goals>-->
-                <!--                    </execution>-->
-                <!--                </executions>-->
+                <executions>
+                    <execution>
+                        <phase>generate-sources</phase>
+                        <goals>
+                            <goal>delombok</goal>
+                        </goals>
+                    </execution>
+                </executions>
             </plugin>
             <plugin>
                 <groupId>org.apache.maven.plugins</groupId>

From f88494a658e5eaad52e120c76a49d4cbc8b1952c Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Mon, 11 Jul 2022 23:40:40 +0100
Subject: [PATCH 065/131] review

---
 .../io/confluent/parallelconsumer/state/ShardKeyTest.java  | 7 +++++--
 1 file changed, 5 insertions(+), 2 deletions(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
index 748cd9b43..adc7bd6b1 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
@@ -35,7 +35,7 @@ void nullKey() {
         ShardKey.of(wc, KEY);
     }
 
-    // todo split
+    // todo split up
     @Test
     void keyTest() {
         ParallelConsumerOptions.ProcessingOrder ordering = KEY;
@@ -43,9 +43,12 @@ void keyTest() {
         TopicPartition topicOneP0 = new TopicPartition("t1", 0);
         String keyOne = "k1";
 
+
+        // same inputs, different key instances equal
         var reck1 = new ConsumerRecord<>(topicOne, 0, 0, keyOne, "v");
         ShardKey key1 = ShardKey.of(reck1, ordering);
-        assertThat(key1).isEqualTo(ShardKey.of(reck1, ordering));
+        ShardKey anotherInstanceWithSameInputs = ShardKey.of(reck1, ordering);
+        assertThat(key1).isEqualTo(anotherInstanceWithSameInputs);
 
         // same topic, same partition, different key
         var reck2 = new ConsumerRecord<>(topicOne, 0, 0, "k2", "v");

From 9010da5eff0beb456ff2db639e1119e431366f3c Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 12 Jul 2022 11:31:21 +0100
Subject: [PATCH 066/131] review

---
 .../java/io/confluent/parallelconsumer/state/ShardKey.java   | 2 +-
 .../parallelconsumer/integrationTests/MultiTopicTest.java    | 2 ++
 .../integrationTests/utils/KafkaClientUtils.java             | 5 +++++
 .../io/confluent/parallelconsumer/state/ShardKeyTest.java    | 1 +
 .../parallelconsumer/truth/CommitHistorySubject.java         | 1 +
 .../io/confluent/parallelconsumer/truth/ConsumerSubject.java | 1 +
 .../truth/LongPollingMockConsumerSubject.java                | 3 +++
 7 files changed, 14 insertions(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
index 2fd66c01e..f803eb6cf 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardKey.java
@@ -13,7 +13,7 @@
 /**
  * Simple value class for processing {@link ShardKey}s to make the various key systems type safe and extendable.
  *
- * @see ShardKeyTest
+ * @author Antony Stubbs
  */
 @Getter
 @FieldDefaults(makeFinal = true, level = AccessLevel.PRIVATE)
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
index db788825e..16258587a 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/MultiTopicTest.java
@@ -30,6 +30,8 @@
 
 /**
  * Originally created to investigate issue report #184
+ *
+ * @author Antony Stubbs
  */
 @Slf4j
 class MultiTopicTest extends BrokerIntegrationTest<String, String> {
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index 8b07b696f..aa63682f8 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -37,6 +37,11 @@
 import static org.apache.commons.lang3.RandomUtils.nextInt;
 import static org.assertj.core.api.Assertions.assertThat;
 
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
 @Slf4j
 public class KafkaClientUtils {
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
index adc7bd6b1..2c646307e 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardKeyTest.java
@@ -15,6 +15,7 @@
 import static org.mockito.Mockito.when;
 
 /**
+ * @author Antony Stubbs
  * @see ShardKey
  */
 class ShardKeyTest {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
index cca1e5853..2c4a3f334 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/CommitHistorySubject.java
@@ -16,6 +16,7 @@
 import static com.google.common.truth.Truth.assertAbout;
 
 /**
+ * @author Antony Stubbs
  * @see CommitHistory
  */
 @UserManagedSubject(CommitHistory.class)
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
index 08773db5d..518ab45e4 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/ConsumerSubject.java
@@ -29,6 +29,7 @@
  * If the system detects this class already exists, it won't attempt to generate a new one. Note that if the base
  * skeleton of this class ever changes, you won't automatically get it updated.
  *
+ * @author Antony Stubbs
  * @see Consumer
  * @see ConsumerParentSubject
  */
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
index d0dcadc89..715ca3e58 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/LongPollingMockConsumerSubject.java
@@ -21,6 +21,9 @@
 import static com.google.common.truth.Truth.assertAbout;
 import static io.confluent.parallelconsumer.truth.CommitHistorySubject.commitHistories;
 
+/**
+ * @author Antony Stubbs
+ */
 @UserManagedSubject(LongPollingMockConsumer.class)
 public class LongPollingMockConsumerSubject<K, V> extends Subject {
 

From fa24a2f31ebd570a9f89942712bddb10a6db1326 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 12 Jul 2022 11:32:01 +0100
Subject: [PATCH 067/131] START: Missing javadoc

---
 .../parallelconsumer/ParallelConsumerOptions.java    |  1 +
 .../parallelconsumer/offsets/BitSetEncoder.java      |  1 +
 .../offsets/BitSetEncodingNotSupportedException.java | 12 ++++++++----
 .../parallelconsumer/offsets/ByteBufferEncoder.java  |  5 +++++
 .../parallelconsumer/offsets/EncodedOffsetPair.java  |  3 +++
 .../offsets/EncodingNotSupportedException.java       | 11 ++++++++---
 .../offsets/NoEncodingPossibleException.java         |  8 ++++++++
 .../parallelconsumer/offsets/OffsetBitSet.java       |  1 +
 .../offsets/OffsetDecodingError.java                 |  9 +++++++++
 .../parallelconsumer/offsets/OffsetEncoder.java      |  4 ++++
 .../parallelconsumer/offsets/OffsetEncoding.java     |  5 +++++
 .../offsets/OffsetMapCodecManager.java               |  2 ++
 .../parallelconsumer/offsets/OffsetRunLength.java    |  5 +++++
 .../offsets/OffsetSimpleSerialisation.java           |  5 +++++
 .../offsets/OffsetSimultaneousEncoder.java           |  1 +
 .../parallelconsumer/offsets/RunLengthEncoder.java   |  2 ++
 .../offsets/RunlengthV1EncodingNotSupported.java     | 10 ++++++++++
 .../parallelconsumer/state/PartitionState.java       |  1 +
 .../state/PartitionStateManager.java                 |  1 +
 .../parallelconsumer/state/ProcessingShard.java      |  2 ++
 .../state/RemovedPartitionState.java                 |  2 ++
 .../parallelconsumer/state/ShardManager.java         |  2 ++
 .../parallelconsumer/state/WorkContainer.java        |  5 +++++
 .../parallelconsumer/state/WorkManager.java          |  5 ++---
 .../csid/utils/LongPollingMockConsumer.java          |  3 +--
 .../parallelconsumer/truth/TruthGeneratorTests.java  |  2 ++
 26 files changed, 96 insertions(+), 12 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
index 771e3e52d..3dd989756 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
@@ -23,6 +23,7 @@
 /**
  * The options for the {@link AbstractParallelEoSStreamProcessor} system.
  *
+ * @author Antony Stubbs
  * @see #builder()
  * @see ParallelConsumerOptions.ParallelConsumerOptionsBuilder
  */
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index 04dcb05dc..490d63bb5 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -35,6 +35,7 @@
  *
  * @see RunLengthEncoder
  * @see OffsetBitSet
+ * @author Antony Stubbs
  */
 @Slf4j
 public class BitSetEncoder extends OffsetEncoder {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java
index 0a0e1c340..96e4a80ab 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java
@@ -3,10 +3,14 @@
 /*-
  * Copyright (C) 2020-2021 Confluent, Inc.
  */
-public class BitSetEncodingNotSupportedException extends EncodingNotSupportedException {
 
-    public BitSetEncodingNotSupportedException(String msg) {
-        super(msg);
-    }
+import lombok.experimental.StandardException;
 
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
+@StandardException
+public class BitSetEncodingNotSupportedException extends EncodingNotSupportedException {
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
index 7459443b0..4ff1c5748 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
@@ -9,6 +9,11 @@
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.ByteArray;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.ByteArrayCompressed;
 
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
 public class ByteBufferEncoder extends OffsetEncoder {
 
     private final ByteBuffer bytesBuffer;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodedOffsetPair.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodedOffsetPair.java
index 65dd6318e..9d2c6422e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodedOffsetPair.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodedOffsetPair.java
@@ -23,6 +23,9 @@
 import static io.confluent.parallelconsumer.offsets.OffsetSimpleSerialisation.deserialiseByteArrayToBitMapString;
 
 /**
+ * todo docs
+ *
+ * @author Antony Stubbs
  * @see #unwrap
  */
 @Slf4j
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java
index 334ae159e..c152e5d43 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java
@@ -5,12 +5,17 @@
  */
 
 import io.confluent.parallelconsumer.internal.ParallelConsumerInternalException;
+import lombok.experimental.StandardException;
 
 /*-
  * Copyright (C) 2020-2021 Confluent, Inc.
  */
+
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
+@StandardException
 public class EncodingNotSupportedException extends ParallelConsumerInternalException {
-    public EncodingNotSupportedException(final String message) {
-        super(message);
-    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java
index edea86d10..df3daae59 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java
@@ -5,6 +5,14 @@
  */
 
 import io.confluent.parallelconsumer.internal.ParallelConsumerInternalException;
+import lombok.experimental.StandardException;
+
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
+@StandardException
 
 public class NoEncodingPossibleException extends ParallelConsumerInternalException {
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
index feb29ab0b..4ee59be18 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
@@ -19,6 +19,7 @@
  * <p>
  * todo unify or refactor with {@link BitSetEncoder}. Why was it ever seperate?
  *
+ * @author Antony Stubbs
  * @see BitSetEncoder
  */
 @Slf4j
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
index 6dfd81ae0..f1fc188ec 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
@@ -3,6 +3,15 @@
 /*-
  * Copyright (C) 2020-2021 Confluent, Inc.
  */
+
+import lombok.experimental.StandardException;
+
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
+@StandardException
 public class OffsetDecodingError extends Exception {
     public OffsetDecodingError(final String s, final IllegalArgumentException a) {
         super(s, a);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
index 76f6ba7ef..7cff71cdf 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
@@ -12,6 +12,10 @@
 
 /**
  * Base OffsetEncoder
+ * <p>
+ * todo docs
+ *
+ * @author Antony Stubbs
  */
 @Slf4j
 public abstract class OffsetEncoder {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java
index 4e31b1b41..deb0c4520 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java
@@ -15,6 +15,11 @@
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v1;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
 
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
 @ToString
 @RequiredArgsConstructor
 public enum OffsetEncoding {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
index 2149b0231..a26e3f358 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
@@ -33,6 +33,8 @@
  * <li>byte2-3: Short: bitset size
  * <li>byte4-n: serialised {@link BitSet}
  * </ul>
+ *
+ * @author Antony Stubbs
  */
 @Slf4j
 public class OffsetMapCodecManager<K, V> {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java
index 92fe44cc6..9335333bc 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java
@@ -18,6 +18,11 @@
 import java.util.concurrent.atomic.AtomicInteger;
 import java.util.function.Supplier;
 
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
 @Slf4j
 @UtilityClass
 public class OffsetRunLength {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java
index 7f9d4ae4a..2260073d3 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java
@@ -22,6 +22,11 @@
 
 import static io.confluent.csid.utils.BackportUtils.readFully;
 
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
 @UtilityClass
 @Slf4j
 public class OffsetSimpleSerialisation {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index 55471af66..d1c827065 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -20,6 +20,7 @@
  * <p>
  * Have results in an accessible structure, easily selecting the highest compression.
  *
+ * @author Antony Stubbs
  * @see #invoke()
  */
 @Slf4j
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
index 9138db719..396159d59 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
@@ -20,6 +20,8 @@
  * <p>
  * One such nature is that gaps between completed offsets get encoded as succeeded offsets. This doesn't matter because
  * they don't exist and we'll neve see them (they no longer exist in the source partition).
+ *
+ * @author Antony Stubbs
  */
 public class RunLengthEncoder extends OffsetEncoder {
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
index 56360a57c..74155e630 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
@@ -1,8 +1,18 @@
 package io.confluent.parallelconsumer.offsets;
 
+import lombok.experimental.StandardException;
+
 /*-
  * Copyright (C) 2020-2021 Confluent, Inc.
  */
+
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
+@StandardException
+
 public class RunlengthV1EncodingNotSupported extends EncodingNotSupportedException {
     public RunlengthV1EncodingNotSupported(final String msg) {
         super(msg);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 96fc04eb8..24621a257 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -29,6 +29,7 @@
 import static lombok.AccessLevel.*;
 
 /**
+ * @author Antony Stubbs
  * @see PartitionStateManager
  */
 @ToString
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 1ec416567..31142d57f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -34,6 +34,7 @@
  * <p>
  * This state is shared between the {@link BrokerPollSystem} thread and the {@link AbstractParallelEoSStreamProcessor}.
  *
+ * @author Antony Stubbs
  * @see PartitionState
  */
 @Slf4j
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
index 90a9d1e97..724aefe98 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ProcessingShard.java
@@ -24,6 +24,8 @@
 
 /**
  * Models the queue of work to be processed, based on the {@link ProcessingOrder} modes.
+ *
+ * @author Antony Stubbs
  */
 @Slf4j
 @RequiredArgsConstructor
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index aef4946f1..39c1e96be 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -25,6 +25,8 @@
  * leak as the collection will forever expand. However, even massive partition counts to a single consumer would be in
  * the hundreds of thousands, this would only result in hundreds of thousands of {@link TopicPartition} object keys all
  * pointing to the same instance of {@link RemovedPartitionState}.
+ *
+ * @author Antony Stubbs
  */
 @Slf4j
 public class RemovedPartitionState<K, V> extends PartitionState<K, V> {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
index 9aba6f4b7..4177022a4 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
@@ -32,6 +32,8 @@
  * This state is shared between the {@link BrokerPollSystem} thread (write - adding and removing shards and work)  and
  * the {@link AbstractParallelEoSStreamProcessor} Controller thread (read - how many records are in the shards?), so
  * must be thread safe.
+ *
+ * @author Antony Stubbs
  */
 @Slf4j
 @RequiredArgsConstructor
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkContainer.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkContainer.java
index a14ed5285..5c89bf4f1 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkContainer.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkContainer.java
@@ -27,6 +27,11 @@
 import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
 import static java.util.Optional.of;
 
+/**
+ * Context object for a given record, carrying completion status, various time stamps, retry data etc..
+ *
+ * @author Antony Stubbs
+ */
 @Slf4j
 @EqualsAndHashCode
 public class WorkContainer<K, V> implements Comparable<WorkContainer<K, V>> {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
index d92317405..e94fd98ca 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
@@ -28,7 +28,7 @@
 /**
  * Sharded, prioritised, offset managed, order controlled, delayed work queue.
  * <p>
- * Low Water Mark - the highest offset (continuously successful) with all it's previous messages succeeded (the offset
+ * Low Watermark - the highest offset (continuously successful) with all it's previous messages succeeded (the offset
  * one commits to broker)
  * <p>
  * High Water Mark - the highest offset which has succeeded (previous may be incomplete)
@@ -37,8 +37,7 @@
  * <p>
  * This state is shared between the {@link BrokerPollSystem} thread and the {@link AbstractParallelEoSStreamProcessor}.
  *
- * @param <K>
- * @param <V>
+ * @author Antony Stubbs
  */
 @Slf4j
 public class WorkManager<K, V> implements ConsumerRebalanceListener {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
index b1977034d..21264c24c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
@@ -26,8 +26,7 @@
  * Used in tests to stub out the behaviour of the real Broker and Client's long polling system (the mock Kafka Consumer
  * doesn't have this behaviour).
  *
- * @param <K>
- * @param <V>
+ * @author Antony Stubbs
  */
 @ToString
 @Slf4j
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/TruthGeneratorTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/TruthGeneratorTests.java
index 1532df721..2fe66919d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/TruthGeneratorTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/truth/TruthGeneratorTests.java
@@ -17,6 +17,8 @@
 
 /**
  * Basic tests of simple usage of the Truth Generator maven plugin
+ *
+ * @author Antony Stubbs
  */
 class TruthGeneratorTests {
 

From c6f264e4549e2a4e4b88902ee7b58c07bfda278c Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 12 Jul 2022 11:37:13 +0100
Subject: [PATCH 068/131] step

---
 .../parallelconsumer/ErrorInUserFunctionException.java    | 8 +++++---
 .../parallelconsumer/ParallelConsumerException.java       | 7 ++++---
 .../offsets/EncodingNotSupportedException.java            | 4 ----
 .../offsets/NoEncodingPossibleException.java              | 4 ----
 .../parallelconsumer/offsets/OffsetDecodingError.java     | 3 ---
 .../offsets/RunlengthV1EncodingNotSupported.java          | 3 ---
 6 files changed, 9 insertions(+), 20 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ErrorInUserFunctionException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ErrorInUserFunctionException.java
index bd1b81f36..bc682ec0a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ErrorInUserFunctionException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ErrorInUserFunctionException.java
@@ -4,11 +4,13 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import lombok.experimental.StandardException;
+
 /**
  * This exception is only used when there is an exception thrown from code provided by the user.
+ *
+ * @author Antony Stubbs
  */
+@StandardException
 public class ErrorInUserFunctionException extends ParallelConsumerException {
-    public ErrorInUserFunctionException(final String message, final Throwable cause) {
-        super(message, cause);
-    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerException.java
index 70d282e23..3826e1f79 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerException.java
@@ -4,12 +4,13 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import lombok.experimental.StandardException;
 
 /**
  * Generic Parallel Consumer {@link RuntimeException} parent.
+ *
+ * @author Antony Stubbs
  */
+@StandardException
 public class ParallelConsumerException extends RuntimeException {
-    public ParallelConsumerException(String message, Throwable cause) {
-        super(message, cause);
-    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java
index c152e5d43..a26ad91a3 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/EncodingNotSupportedException.java
@@ -7,10 +7,6 @@
 import io.confluent.parallelconsumer.internal.ParallelConsumerInternalException;
 import lombok.experimental.StandardException;
 
-/*-
- * Copyright (C) 2020-2021 Confluent, Inc.
- */
-
 /**
  * todo docs
  *
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java
index df3daae59..cd89973db 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/NoEncodingPossibleException.java
@@ -15,8 +15,4 @@
 @StandardException
 
 public class NoEncodingPossibleException extends ParallelConsumerInternalException {
-
-    public NoEncodingPossibleException(String msg) {
-        super(msg);
-    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
index f1fc188ec..642bc1c77 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
@@ -13,7 +13,4 @@
  */
 @StandardException
 public class OffsetDecodingError extends Exception {
-    public OffsetDecodingError(final String s, final IllegalArgumentException a) {
-        super(s, a);
-    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
index 74155e630..adc5ffbed 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
@@ -14,7 +14,4 @@
 @StandardException
 
 public class RunlengthV1EncodingNotSupported extends EncodingNotSupportedException {
-    public RunlengthV1EncodingNotSupported(final String msg) {
-        super(msg);
-    }
 }

From a5b157374ce66414159590a557f4f0cb08cb0056 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 12 Jul 2022 12:06:34 +0100
Subject: [PATCH 069/131] review

---
 .../offsets/BitSetEncodingNotSupportedException.java          | 2 +-
 .../io/confluent/parallelconsumer/offsets/OffsetBitSet.java   | 2 +-
 .../parallelconsumer/offsets/OffsetDecodingError.java         | 2 +-
 .../confluent/parallelconsumer/offsets/OffsetRunLength.java   | 2 +-
 .../parallelconsumer/offsets/OffsetSimpleSerialisation.java   | 2 +-
 .../offsets/RunlengthV1EncodingNotSupported.java              | 4 ++++
 6 files changed, 9 insertions(+), 5 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java
index 96e4a80ab..dd6e2a7ac 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncodingNotSupportedException.java
@@ -1,7 +1,7 @@
 package io.confluent.parallelconsumer.offsets;
 
 /*-
- * Copyright (C) 2020-2021 Confluent, Inc.
+ * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
 import lombok.experimental.StandardException;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
index 4ee59be18..cd07ad691 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
@@ -1,7 +1,7 @@
 package io.confluent.parallelconsumer.offsets;
 
 /*-
- * Copyright (C) 2020-2021 Confluent, Inc.
+ * Copyright (C) 2020-2022 Confluent, Inc.
  */
 import io.confluent.parallelconsumer.internal.InternalRuntimeError;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
index 642bc1c77..969f41ae8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetDecodingError.java
@@ -1,7 +1,7 @@
 package io.confluent.parallelconsumer.offsets;
 
 /*-
- * Copyright (C) 2020-2021 Confluent, Inc.
+ * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
 import lombok.experimental.StandardException;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java
index 9335333bc..f7fc3dba1 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetRunLength.java
@@ -1,7 +1,7 @@
 package io.confluent.parallelconsumer.offsets;
 
 /*-
- * Copyright (C) 2020-2021 Confluent, Inc.
+ * Copyright (C) 2020-2022 Confluent, Inc.
  */
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
 import lombok.experimental.UtilityClass;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java
index 2260073d3..11414cd0e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimpleSerialisation.java
@@ -1,7 +1,7 @@
 package io.confluent.parallelconsumer.offsets;
 
 /*-
- * Copyright (C) 2020-2021 Confluent, Inc.
+ * Copyright (C) 2020-2022 Confluent, Inc.
  */
 import com.github.luben.zstd.ZstdInputStream;
 import com.github.luben.zstd.ZstdOutputStream;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
index adc5ffbed..43e1abe8f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
@@ -1,5 +1,9 @@
 package io.confluent.parallelconsumer.offsets;
 
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
 import lombok.experimental.StandardException;
 
 /*-

From 5e8bfb6482e523aef409c624809086a0114d34a6 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 30 Sep 2022 16:28:07 +0100
Subject: [PATCH 070/131] START: fixes #409: Truncate state on offset high
 reset

Track expected offsets returned from broker, and truncate where needed.
---
 .../offsets/OffsetMapCodecManager.java        |  3 +-
 .../state/PartitionState.java                 | 59 +++++++++++++++----
 .../state/PartitionStateManager.java          |  2 +-
 .../state/PartitionStateTest.java             | 49 +++++++++++++++
 4 files changed, 101 insertions(+), 12 deletions(-)
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
index 7283f9b0b..83c050224 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
@@ -72,6 +72,7 @@ public static class HighestOffsetAndIncompletes {
         /**
          * Of the offsets encoded, the incomplete ones.
          */
+        // todo change to List as Sets have no order
         Set<Long> incompleteOffsets;
 
         public static HighestOffsetAndIncompletes of(long highestSeenOffset) {
@@ -164,7 +165,7 @@ public static HighestOffsetAndIncompletes deserialiseIncompleteOffsetMapFromBase
     PartitionState<K, V> decodePartitionState(TopicPartition tp, OffsetAndMetadata offsetData) throws OffsetDecodingError {
         HighestOffsetAndIncompletes incompletes = deserialiseIncompleteOffsetMapFromBase64(offsetData);
         log.debug("Loaded incomplete offsets from offset payload {}", incompletes);
-        return new PartitionState<K, V>(tp, incompletes);
+        return new PartitionState<>(tp, incompletes);
     }
 
     public String makeOffsetMetadataPayload(long baseOffsetForPartition, PartitionState<K, V> state) throws NoEncodingPossibleException {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 849e90f7c..624944a6d 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -15,10 +15,7 @@
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 
-import java.util.Collections;
-import java.util.NavigableMap;
-import java.util.Optional;
-import java.util.Set;
+import java.util.*;
 import java.util.concurrent.ConcurrentSkipListMap;
 import java.util.concurrent.ConcurrentSkipListSet;
 import java.util.stream.Collectors;
@@ -59,7 +56,12 @@ public class PartitionState<K, V> {
      * so that the broker polling thread can grab it, if it wants to commit - i.e. the poller would not prepare/query
      * the data for itself. See also #200 Refactor: Consider a shared nothing architecture.
      */
-    private final ConcurrentSkipListSet<Long> incompleteOffsets;
+    private ConcurrentSkipListSet<Long> incompleteOffsets;
+
+    /**
+     * Marker for the first record to be tracked. Used for some initial analysis.
+     */
+    private boolean noWorkAddedYet = true;
 
     /**
      * Cache view of the state of the partition. Is set dirty when the incomplete state of any offset changes. Is set
@@ -126,6 +128,7 @@ public PartitionState(TopicPartition tp, OffsetMapCodecManager.HighestOffsetAndI
         this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
         this.incompleteOffsets = new ConcurrentSkipListSet<>(offsetData.getIncompleteOffsets());
         this.offsetHighestSucceeded = this.offsetHighestSeen;
+        this.nextExpectedPolledOffset = getNextExpectedInitialPolledOffset();
     }
 
     private void maybeRaiseHighestSeenOffset(final long offset) {
@@ -199,11 +202,43 @@ private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
 
     public void addWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
+
+//        if (noWorkAddedYet) {
+//            noWorkAddedYet = false;
+//            long bootstrapOffset = wc.offset();
+        maybeTruncateBelow(newOffset);
+//        }
+
         maybeRaiseHighestSeenOffset(newOffset);
         commitQueue.put(newOffset, wc);
         incompleteOffsets.add(newOffset);
     }
 
+    /**
+     * If the offset is higher than expected, according to the previously committed / polled offset, truncate up to it.
+     * Offsets between have disappeared and will never be polled again.
+     */
+    private void maybeTruncateBelow(long polledOffset) {
+        long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
+        boolean bootstrapRecordAboveExpected = polledOffset > nextExpectedPolledOffset;
+        if (bootstrapRecordAboveExpected) {
+            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'",
+                    polledOffset,
+                    nextExpectedPolledOffset);
+            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(polledOffset);
+            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
+            this.incompleteOffsets = wrapped;
+        }
+
+        this.nextExpectedPolledOffset = polledOffset + 1;
+    }
+
+    private long nextExpectedPolledOffset = KAFKA_OFFSET_ABSENCE;
+
+    private long getNextExpectedPolledOffset() {
+        return nextExpectedPolledOffset;
+    }
+
     /**
      * Has this partition been removed? No.
      *
@@ -220,18 +255,22 @@ public Optional<OffsetAndMetadata> getCommitDataIfDirty() {
             return empty();
     }
 
-    private OffsetAndMetadata createOffsetAndMetadata() {
+    // visible for testing
+    protected OffsetAndMetadata createOffsetAndMetadata() {
         Optional<String> payloadOpt = tryToEncodeOffsets();
-        long nextOffset = getNextExpectedPolledOffset();
+        long nextOffset = getNextExpectedInitialPolledOffset();
         return payloadOpt
                 .map(s -> new OffsetAndMetadata(nextOffset, s))
                 .orElseGet(() -> new OffsetAndMetadata(nextOffset));
     }
 
     /**
-     * Defines as the offset one below the highest sequentially succeeded offset
+     * Next offset expected to be polled, upon freshly connecting to a broker.
+     * <p>
+     * Defines as the offset one below the highest sequentially succeeded offset.
      */
-    private long getNextExpectedPolledOffset() {
+    // visible for testing
+    protected long getNextExpectedInitialPolledOffset() {
         return getOffsetHighestSequentialSucceeded() + 1;
     }
 
@@ -297,7 +336,7 @@ private Optional<String> tryToEncodeOffsets() {
         try {
             // todo refactor use of null shouldn't be needed. Is OffsetMapCodecManager stateful? remove null #233
             OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(null);
-            long offsetOfNextExpectedMessage = getNextExpectedPolledOffset();
+            long offsetOfNextExpectedMessage = getNextExpectedInitialPolledOffset();
             String offsetMapPayload = om.makeOffsetMetadataPayload(offsetOfNextExpectedMessage, this);
             boolean mustStrip = updateBlockFromEncodingResult(offsetMapPayload);
             if (mustStrip) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 2aff1eeb8..857c15e25 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -334,7 +334,7 @@ void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
         log.debug("Incoming {} new records...", recordsMap.count());
         for (var partition : recordsMap.partitions()) {
             var recordsList = recordsMap.records(partition);
-            var epochOfInboundRecords = recordsList.getEpochOfPartitionAtPoll();
+            long epochOfInboundRecords = recordsList.getEpochOfPartitionAtPoll();
             for (var rec : recordsList.getRecords()) {
                 maybeRegisterNewRecordAsWork(epochOfInboundRecords, rec);
             }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
new file mode 100644
index 000000000..9c55cca6a
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -0,0 +1,49 @@
+package io.confluent.parallelconsumer.state;
+
+import com.google.common.truth.Truth;
+import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
+import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
+import org.apache.kafka.common.TopicPartition;
+import org.junit.jupiter.api.Test;
+import pl.tlinkowski.unij.api.UniLists;
+
+import java.util.HashSet;
+import java.util.List;
+import java.util.Optional;
+import java.util.stream.Collectors;
+
+class PartitionStateTest {
+
+    ModelUtils mu = new ModelUtils(new PCModuleTestEnv());
+
+    /**
+     * @see PartitionState#maybeTruncateBelow
+     */
+    @Test
+    void bootstrapTruncation() {
+        TopicPartition tp = new TopicPartition("topic", 0);
+        long unexpectedlyHighOffset = 20L;
+        final long previouslyCommittedOffset = 11L;
+        List<Long> incompletes = UniLists.of(previouslyCommittedOffset, 15L, unexpectedlyHighOffset, 60L, 80L);
+        List<Long> expectedTruncatedIncompletes = incompletes.stream()
+                .filter(offset -> offset >= unexpectedlyHighOffset)
+                .collect(Collectors.toList());
+
+        HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(100L), new HashSet<>(incompletes)); // todo fix set/list
+
+        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+
+
+        var w20 = mu.createWorkFor(unexpectedlyHighOffset);
+
+        // bootstrap the first record, triggering truncation - it's offset #unexpectedlyHighOffset, but we were expecting #previouslyCommittedOffset
+        state.addWorkContainer(w20);
+
+
+        Truth.assertThat(state.getNextExpectedInitialPolledOffset()).isEqualTo(unexpectedlyHighOffset);
+
+        Truth.assertThat(state.getIncompleteOffsetsBelowHighestSucceeded()).containsExactlyElementsIn(expectedTruncatedIncompletes);
+
+    }
+
+}
\ No newline at end of file

From d1c42d692ddf8b3e152914d7012be5f76a576528 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 30 Sep 2022 16:40:47 +0100
Subject: [PATCH 071/131] review

---
 CHANGELOG.adoc                                                | 1 +
 README.adoc                                                   | 1 +
 .../confluent/parallelconsumer/state/PartitionStateTest.java  | 4 ++++
 3 files changed, 6 insertions(+)

diff --git a/CHANGELOG.adoc b/CHANGELOG.adoc
index b049e070a..582124344 100644
--- a/CHANGELOG.adoc
+++ b/CHANGELOG.adoc
@@ -40,6 +40,7 @@ endif::[]
 
 * fixes #419 NoSuchElementException during race condition in PartitionState (#422)
 * Fixes #412: ClassCastException with retryDelayProvider (#417)
+* Fixes #409: Parallel Consumer keeps committing the old offset after OFFSET_OUT_OF_RANGE in auto.offset.reset = latest (#425)
 
 
 == v0.5.2.2
diff --git a/README.adoc b/README.adoc
index 62e8edde8..ddeecb185 100644
--- a/README.adoc
+++ b/README.adoc
@@ -1312,6 +1312,7 @@ endif::[]
 
 * fixes #419 NoSuchElementException during race condition in PartitionState (#422)
 * Fixes #412: ClassCastException with retryDelayProvider (#417)
+* Fixes #409: Parallel Consumer keeps committing the old offset after OFFSET_OUT_OF_RANGE in auto.offset.reset = latest (#425)
 
 == v0.5.2.2
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
index 9c55cca6a..40886c4a3 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -1,5 +1,9 @@
 package io.confluent.parallelconsumer.state;
 
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
 import com.google.common.truth.Truth;
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;

From 5dca73c03d3dbcac441e161f7f4185d05154000f Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 30 Sep 2022 16:41:40 +0100
Subject: [PATCH 072/131] review

---
 .../io/confluent/parallelconsumer/state/PartitionStateTest.java  | 1 +
 1 file changed, 1 insertion(+)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
index 40886c4a3..8f43fa215 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -23,6 +23,7 @@ class PartitionStateTest {
     /**
      * @see PartitionState#maybeTruncateBelow
      */
+    // parameter test with offsets closer together to check off by one
     @Test
     void bootstrapTruncation() {
         TopicPartition tp = new TopicPartition("topic", 0);

From 23c289f42f93e506baa0fbcf5e901bee68f98a1d Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 30 Sep 2022 17:22:47 +0100
Subject: [PATCH 073/131] step - continuous checking and restructure

---
 .../io/confluent/csid/utils/JavaUtils.java    | 10 ++-
 .../state/PartitionState.java                 | 18 +++++-
 .../state/PartitionStateManager.java          | 63 ++++++++++++++-----
 3 files changed, 72 insertions(+), 19 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
index bba786ed7..37e56237d 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
@@ -20,9 +20,13 @@
 @UtilityClass
 public class JavaUtils {
 
-    public static <T> Optional<T> getLast(final List<T> commitHistory) {
-        if (commitHistory.isEmpty()) return Optional.empty();
-        return Optional.of(commitHistory.get(commitHistory.size() - 1));
+    public static <T> Optional<T> getLast(final List<T> someList) {
+        if (someList.isEmpty()) return Optional.empty();
+        return Optional.of(someList.get(someList.size() - 1));
+    }
+
+    public static <T> Optional<T> getFirst(final List<T> someList) {
+        return someList.isEmpty() ? Optional.empty() : Optional.of(someList.get(0));
     }
 
     public static <T> Optional<T> getOnlyOne(final Map<String, T> stringMapMap) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 624944a6d..73af0a68c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -206,7 +206,7 @@ public void addWorkContainer(WorkContainer<K, V> wc) {
 //        if (noWorkAddedYet) {
 //            noWorkAddedYet = false;
 //            long bootstrapOffset = wc.offset();
-        maybeTruncateBelow(newOffset);
+//        maybeTruncateBelow(newOffset);
 //        }
 
         maybeRaiseHighestSeenOffset(newOffset);
@@ -233,6 +233,21 @@ private void maybeTruncateBelow(long polledOffset) {
         this.nextExpectedPolledOffset = polledOffset + 1;
     }
 
+    public void maybeTruncate(long batchStartOffset, long batchEndOffset) {
+        long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
+        boolean bootstrapRecordAboveExpected = batchStartOffset > nextExpectedPolledOffset;
+        if (bootstrapRecordAboveExpected) {
+            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'",
+                    batchStartOffset,
+                    nextExpectedPolledOffset);
+            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(batchStartOffset);
+            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
+            this.incompleteOffsets = wrapped;
+        }
+
+        this.nextExpectedPolledOffset = batchEndOffset + 1;
+    }
+
     private long nextExpectedPolledOffset = KAFKA_OFFSET_ABSENCE;
 
     private long getNextExpectedPolledOffset() {
@@ -398,5 +413,6 @@ public void onPartitionsRemoved(ShardManager<K, V> sm) {
     public boolean isBlocked() {
         return !isAllowedMoreRecords();
     }
+
 }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 857c15e25..488ca6b9c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -6,6 +6,7 @@
 
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import io.confluent.parallelconsumer.internal.*;
+import io.confluent.parallelconsumer.internal.EpochAndRecordsMap.RecordsAndEpoch;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
 import lombok.Getter;
 import lombok.NonNull;
@@ -21,6 +22,8 @@
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.stream.Collectors;
 
+import static io.confluent.csid.utils.JavaUtils.getFirst;
+import static io.confluent.csid.utils.JavaUtils.getLast;
 import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
 import static io.confluent.csid.utils.StringUtils.msg;
 
@@ -244,6 +247,7 @@ boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
         return false;
     }
 
+    // todo move to partition state
     public boolean isRecordPreviouslyCompleted(ConsumerRecord<K, V> rec) {
         var tp = toTopicPartition(rec);
         var partitionState = getPartitionState(tp);
@@ -309,6 +313,7 @@ public boolean isBlocked(final TopicPartition topicPartition) {
         return !isAllowedMoreRecords(topicPartition);
     }
 
+    // todo move to partition state
     public boolean isPartitionRemovedOrNeverAssigned(ConsumerRecord<?, ?> rec) {
         TopicPartition topicPartition = toTopicPartition(rec);
         var partitionState = getPartitionState(topicPartition);
@@ -333,10 +338,12 @@ public void onFailure(WorkContainer<K, V> wc) {
     void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
         log.debug("Incoming {} new records...", recordsMap.count());
         for (var partition : recordsMap.partitions()) {
-            var recordsList = recordsMap.records(partition);
+            RecordsAndEpoch recordsList = recordsMap.records(partition);
             long epochOfInboundRecords = recordsList.getEpochOfPartitionAtPoll();
-            for (var rec : recordsList.getRecords()) {
-                maybeRegisterNewRecordAsWork(epochOfInboundRecords, rec);
+            List<ConsumerRecord<K, V>> recordPollBatch = recordsList.getRecords();
+            if (!recordPollBatch.isEmpty()) {
+                // should always not be empty, but...
+                maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordsList);
             }
         }
     }
@@ -344,26 +351,52 @@ void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
     /**
      * @see #maybeRegisterNewRecordAsWork(EpochAndRecordsMap)
      */
-    private void maybeRegisterNewRecordAsWork(@NonNull Long epochOfInboundRecords, @NonNull ConsumerRecord<K, V> rec) {
-        // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
-        var currentPartitionEpoch = getEpochOfPartitionForRecord(rec);
-        if (Objects.equals(epochOfInboundRecords, currentPartitionEpoch)) {
+    // todo move into PartitionState
+    // todo too deep
+    private void maybeRegisterNewRecordAsWork(@NonNull Long epochOfInboundRecords, @NonNull RecordsAndEpoch recordsList) {
+        List<ConsumerRecord<K, V>> recordPollBatch = recordsList.getRecords();
+
+        if (!recordPollBatch.isEmpty()) {
+            final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
+            //noinspection OptionalGetWithoutIsPresent -- already checked not empty
+            ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
+            long batchStartOffset = sampleRecord.offset();
+
+            // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
+            var currentPartitionEpoch = getEpochOfPartitionForRecord(sampleRecord);
+            if (Objects.equals(epochOfInboundRecords, currentPartitionEpoch)) {
+
+                // todo move to partition state from here, as epoch apparently has to be tracked in PSM
+                if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
+                    log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(sampleRecord), sampleRecord);
+                } else {
+                    //noinspection OptionalGetWithoutIsPresent -- already checked not empty
+                    long batchEndOffset = getLast(recordPollBatch).get().offset(); // NOSONAR
+
+                    TopicPartition partition = new TopicPartition(sampleRecord.topic(), sampleRecord.partition());
+                    getPartitionState(partition).maybeTruncate(batchStartOffset, batchEndOffset);
 
-            if (isPartitionRemovedOrNeverAssigned(rec)) {
-                log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(rec), rec);
+                    maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
+                }
+            } else {
+                log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
+                        epochOfInboundRecords, currentPartitionEpoch);
             }
+        }
+    }
 
-            if (isRecordPreviouslyCompleted(rec)) {
-                log.trace("Record previously completed, skipping. offset: {}", rec.offset());
+    // todo move to partition state
+    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
+        for (var aRecord : recordPollBatch) {
+            if (isRecordPreviouslyCompleted(aRecord)) {
+                log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
             } else {
-                var work = new WorkContainer<>(epochOfInboundRecords, rec, module);
+                //noinspection ObjectAllocationInLoop
+                var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
 
                 sm.addWorkContainer(work);
                 addWorkContainer(work);
             }
-        } else {
-            log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
-                    epochOfInboundRecords, currentPartitionEpoch);
         }
     }
 

From 1fcc658ca65bc20acbfe30cef2af7918f0384101 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 30 Sep 2022 19:11:21 +0100
Subject: [PATCH 074/131] review

---
 .../parallelconsumer/ErrorInUserFunctionException.java          | 0
 .../io/confluent/parallelconsumer/state/PartitionState.java     | 2 ++
 2 files changed, 2 insertions(+)
 delete mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ErrorInUserFunctionException.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ErrorInUserFunctionException.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ErrorInUserFunctionException.java
deleted file mode 100644
index e69de29bb..000000000
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 8c92c5f73..3fac724d2 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -29,6 +29,8 @@
 import static lombok.AccessLevel.*;
 
 /**
+ * todo docs
+ *
  * @author Antony Stubbs
  * @see PartitionStateManager
  */

From 2ea35735eeaad32a59794b1c5b255a38d5d8bb59 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 1 Oct 2022 20:09:15 +0100
Subject: [PATCH 075/131] incomplete offsets docs

---
 .../offsets/BitSetEncoder.java                |  4 +-
 .../offsets/OffsetEncoding.java               |  6 ++
 .../state/PartitionState.java                 | 68 +++++++++++--------
 3 files changed, 49 insertions(+), 29 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index 04dcb05dc..47d25850c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -6,6 +6,7 @@
 
 import io.confluent.csid.utils.StringUtils;
 import io.confluent.parallelconsumer.internal.InternalRuntimeError;
+import io.confluent.parallelconsumer.state.PartitionState;
 import lombok.Getter;
 import lombok.extern.slf4j.Slf4j;
 
@@ -27,12 +28,13 @@
  * Sequential or not. Because as records are always in commit order, if we've seen a range of offsets, we know we've
  * seen all that exist (within said range). So if offset 8 is missing from the partition, we will encode it as having
  * been completed (when in fact it doesn't exist), because we only compare against known incompletes, and assume all
- * others are complete.
+ * others are complete. See {@link PartitionState#incompleteOffsets} for more discussion on this.
  * <p>
  * So, when we deserialize, the INCOMPLETES collection is then restored, and that's what's used to compare to see if a
  * record should be skipped or not. So if record 8 is recorded as completed, it will be absent from the restored
  * INCOMPLETES list, and we are assured we will never see record 8.
  *
+ * @see PartitionState#incompleteOffsets
  * @see RunLengthEncoder
  * @see OffsetBitSet
  */
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java
index 4e31b1b41..f788eea84 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoding.java
@@ -3,6 +3,7 @@
 /*-
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
+
 import lombok.Getter;
 import lombok.RequiredArgsConstructor;
 import lombok.ToString;
@@ -15,6 +16,11 @@
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v1;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
 
+/**
+ * Offset encoding MagicNumbers to {@link OffsetEncoder}.
+ *
+ * @author Antony Stubbs
+ */
 @ToString
 @RequiredArgsConstructor
 public enum OffsetEncoding {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 73af0a68c..390fa3516 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -26,6 +26,8 @@
 import static lombok.AccessLevel.*;
 
 /**
+ * Our view of our state of the partitions that we've been assigned.
+ *
  * @see PartitionStateManager
  */
 @ToString
@@ -42,19 +44,42 @@ public class PartitionState<K, V> {
     private final TopicPartition tp;
 
     /**
-     * Offset data beyond the highest committable offset, which haven't totally succeeded.
+     * Offsets beyond the highest committable offset (see {@link #getOffsetHighestSequentialSucceeded()}) which haven't
+     * totally succeeded. Based on decoded metadata and polled records (not offset ranges).
+     * <p>
+     * <p>
+     * <h2>How does this handle gaps in the offsets in the source partitions?:</h2>
+     * <p>
+     * We track per record acknowledgement, by only storing the offsets of records <em>OF WHICH WE'VE RECEIVED</em>
+     * through {@link KafkaConsumer#poll} calls.
+     * <p>
+     * This is as explicitly opposed to looking at the lowest offset we've polled, and synthetically creating a list of
+     * EXPECTED offsets from the range from it to the highest polled. If we were to construct this offset range
+     * synthetically like this, then we would need to expect to process/receive records which might not exist, for
+     * whatever reason, usually due to compaction.
+     * <p>
+     * Instead, the offsets tracked are only determined from the records we've given to process from the broker - we
+     * make no assumptions about which offsets exist. This way we don't have to worry about gaps in the offsets. Also, a
+     * nice outcome of this is that a gap in the offsets is effectively the same as, as far as we're concerned, an
+     * offset which has succeeded - because either way we have no action to take.
      * <p>
      * This is independent of the actual queued {@link WorkContainer}s. This is because to start with, data about
      * incomplete offsets come from the encoded metadata payload that gets committed along with the highest committable
-     * offset ({@link #getOffsetHighestSequentialSucceeded()}). They are not always in sync.
+     * offset ({@link #getOffsetHighestSequentialSucceeded()}) and so we don't yet have ConsumerRecord's for those
+     * offsets until we start polling for them. And so they are not always in sync.
      * <p>
-     * TreeSet so we can always get the lowest offset.
+     * <p>
+     * <h2>Concurrency:</h2>
      * <p>
      * Needs to be concurrent because, the committer requesting the data to commit may be another thread - the broker
      * polling sub system - {@link BrokerPollSystem#maybeDoCommit}. The alternative to having this as a concurrent
      * collection, would be to have the control thread prepare possible commit data on every cycle, and park that data
      * so that the broker polling thread can grab it, if it wants to commit - i.e. the poller would not prepare/query
-     * the data for itself. See also #200 Refactor: Consider a shared nothing architecture.
+     * the data for itself. This requirement is removed in the upcoming PR #200 Refactor: Consider a shared nothing
+     * architecture.
+     *
+     * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
+     *         storage
      */
     private ConcurrentSkipListSet<Long> incompleteOffsets;
 
@@ -222,9 +247,7 @@ private void maybeTruncateBelow(long polledOffset) {
         long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
         boolean bootstrapRecordAboveExpected = polledOffset > nextExpectedPolledOffset;
         if (bootstrapRecordAboveExpected) {
-            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'",
-                    polledOffset,
-                    nextExpectedPolledOffset);
+            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'", polledOffset, nextExpectedPolledOffset);
             NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(polledOffset);
             ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
             this.incompleteOffsets = wrapped;
@@ -237,9 +260,7 @@ public void maybeTruncate(long batchStartOffset, long batchEndOffset) {
         long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
         boolean bootstrapRecordAboveExpected = batchStartOffset > nextExpectedPolledOffset;
         if (bootstrapRecordAboveExpected) {
-            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'",
-                    batchStartOffset,
-                    nextExpectedPolledOffset);
+            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'", batchStartOffset, nextExpectedPolledOffset);
             NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(batchStartOffset);
             ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
             this.incompleteOffsets = wrapped;
@@ -264,19 +285,15 @@ public boolean isRemoved() {
     }
 
     public Optional<OffsetAndMetadata> getCommitDataIfDirty() {
-        if (isDirty())
-            return of(createOffsetAndMetadata());
-        else
-            return empty();
+        if (isDirty()) return of(createOffsetAndMetadata());
+        else return empty();
     }
 
     // visible for testing
     protected OffsetAndMetadata createOffsetAndMetadata() {
         Optional<String> payloadOpt = tryToEncodeOffsets();
         long nextOffset = getNextExpectedInitialPolledOffset();
-        return payloadOpt
-                .map(s -> new OffsetAndMetadata(nextOffset, s))
-                .orElseGet(() -> new OffsetAndMetadata(nextOffset));
+        return payloadOpt.map(s -> new OffsetAndMetadata(nextOffset, s)).orElseGet(() -> new OffsetAndMetadata(nextOffset));
     }
 
     /**
@@ -294,8 +311,7 @@ protected long getNextExpectedInitialPolledOffset() {
      */
     public Set<Long> getAllIncompleteOffsets() {
         //noinspection FuseStreamOperations - only in java 10
-        return Collections.unmodifiableSet(incompleteOffsets.parallelStream()
-                .collect(Collectors.toSet()));
+        return Collections.unmodifiableSet(incompleteOffsets.parallelStream().collect(Collectors.toSet()));
     }
 
     /**
@@ -306,11 +322,12 @@ public Set<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         //noinspection FuseStreamOperations Collectors.toUnmodifiableSet since v10
         return Collections.unmodifiableSet(incompleteOffsets.parallelStream()
                 // todo less than or less than and equal?
-                .filter(x -> x < highestSucceeded)
-                .collect(Collectors.toSet()));
+                .filter(x -> x < highestSucceeded).collect(Collectors.toSet()));
     }
 
     /**
+     * The offset which is itself, and all before, all successfully completed (or skipped).
+     * <p>
      * Defined for our purpose (as only used in definition of what offset to poll for next), as the offset one below the
      * lowest incomplete offset.
      */
@@ -377,16 +394,11 @@ private boolean updateBlockFromEncodingResult(String offsetMapPayload) {
             // exceeded maximum API allowed, strip the payload
             mustStrip = true;
             setAllowedMoreRecords(false);
-            log.warn("Offset map data too large (size: {}) to fit in metadata payload hard limit of {} - cannot include in commit. " +
-                            "Warning: messages might be replayed on rebalance. " +
-                            "See kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize = {} and issue #47.",
-                    metaPayloadLength, DefaultMaxMetadataSize, DefaultMaxMetadataSize);
+            log.warn("Offset map data too large (size: {}) to fit in metadata payload hard limit of {} - cannot include in commit. " + "Warning: messages might be replayed on rebalance. " + "See kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize = {} and issue #47.", metaPayloadLength, DefaultMaxMetadataSize, DefaultMaxMetadataSize);
         } else if (metaPayloadLength > getPressureThresholdValue()) { // and thus metaPayloadLength <= DefaultMaxMetadataSize
             // try to turn on back pressure before max size is reached
             setAllowedMoreRecords(false);
-            log.warn("Payload size {} higher than threshold {}, but still lower than max {}. Will write payload, but will " +
-                            "not allow further messages, in order to allow the offset data to shrink (via succeeding messages).",
-                    metaPayloadLength, getPressureThresholdValue(), DefaultMaxMetadataSize);
+            log.warn("Payload size {} higher than threshold {}, but still lower than max {}. Will write payload, but will " + "not allow further messages, in order to allow the offset data to shrink (via succeeding messages).", metaPayloadLength, getPressureThresholdValue(), DefaultMaxMetadataSize);
 
         } else { // and thus (metaPayloadLength <= pressureThresholdValue)
             setAllowedMoreRecords(true);

From 835888a10f280c2788c3bd2e002dab4e71f08547 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 1 Oct 2022 20:23:32 +0100
Subject: [PATCH 076/131] docs and rename

---
 .../parallelconsumer/state/PartitionState.java     | 14 +++++++++-----
 .../state/PartitionStateManager.java               |  8 ++++----
 .../state/RemovedPartitionState.java               |  2 +-
 .../WorkManagerOffsetMapCodecManagerTest.java      |  2 +-
 .../parallelconsumer/state/PartitionStateTest.java | 13 +++++++++++--
 5 files changed, 26 insertions(+), 13 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 390fa3516..e84891753 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -132,15 +132,17 @@ public class PartitionState<K, V> {
     private boolean allowedMoreRecords = true;
 
     /**
-     * Map of offsets to WorkUnits.
+     * Map of offsets to {@link WorkContainer}s.
      * <p>
      * Need to record globally consumed records, to ensure correct offset order committal. Cannot rely on incrementally
-     * advancing offsets, as this isn't a guarantee of kafka's.
+     * advancing offsets, as this isn't a guarantee of kafka's (see {@link #incompleteOffsets}).
      * <p>
      * Concurrent because either the broker poller thread or the control thread may be requesting offset to commit
-     * ({@link #getCommitDataIfDirty()}), or reading upon {@link #onPartitionsRemoved}
+     * ({@link #getCommitDataIfDirty()}), or reading upon {@link #onPartitionsRemoved}. This requirement is removed in
+     * the upcoming PR #200 Refactor: Consider a shared nothing * architecture.
      */
-    // todo doesn't need to be concurrent any more?
+    // todo rename - it's not a queue of things to be committed - it's a collection of incomplete offsets and their WorkContainers
+    // todo delete? seems this can be replaced by #incompletes - the work container info isn't used
     @ToString.Exclude
     private final NavigableMap<Long, WorkContainer<K, V>> commitQueue = new ConcurrentSkipListMap<>();
 
@@ -225,7 +227,7 @@ private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
         }
     }
 
-    public void addWorkContainer(WorkContainer<K, V> wc) {
+    public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
 
 //        if (noWorkAddedYet) {
@@ -236,6 +238,8 @@ public void addWorkContainer(WorkContainer<K, V> wc) {
 
         maybeRaiseHighestSeenOffset(newOffset);
         commitQueue.put(newOffset, wc);
+
+        // idempotently add the offset to our incompletes track - if it was already there from loading our metadata on startup, there is no affect
         incompleteOffsets.add(newOffset);
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 488ca6b9c..03c6a25f5 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -25,7 +25,6 @@
 import static io.confluent.csid.utils.JavaUtils.getFirst;
 import static io.confluent.csid.utils.JavaUtils.getLast;
 import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
-import static io.confluent.csid.utils.StringUtils.msg;
 
 /**
  * In charge of managing {@link PartitionState}s.
@@ -291,9 +290,10 @@ public long getHighestSeenOffset(final TopicPartition tp) {
         return getPartitionState(tp).getOffsetHighestSeen();
     }
 
-    public void addWorkContainer(final WorkContainer<K, V> wc) {
+    // todo move to partition state
+    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
         var tp = wc.getTopicPartition();
-        getPartitionState(tp).addWorkContainer(wc);
+        getPartitionState(tp).addNewIncompleteWorkContainer(wc);
     }
 
     /**
@@ -395,7 +395,7 @@ private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<Consu
                 var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
 
                 sm.addWorkContainer(work);
-                addWorkContainer(work);
+                addNewIncompleteWorkContainer(work);
             }
         }
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index aef4946f1..e3bc66065 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -55,7 +55,7 @@ public TopicPartition getTp() {
     }
 
     @Override
-    public void addWorkContainer(final WorkContainer<K, V> wc) {
+    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
         // no-op
         log.warn("Dropping new work container for partition no longer assigned. WC: {}", wc);
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
index 5bdca1c90..5469c6335 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
@@ -90,7 +90,7 @@ void setupMock() {
     private void injectSucceededWorkAtOffset(long offset) {
         WorkContainer<String, String> workContainer = new WorkContainer<>(0, mockCr, mock(PCModuleTestEnv.class));
         Mockito.doReturn(offset).when(mockCr).offset();
-        state.addWorkContainer(workContainer);
+        state.addNewIncompleteWorkContainer(workContainer);
         state.onSuccess(workContainer); // in this case the highest seen is also the highest succeeded
     }
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
index 8f43fa215..499e81718 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -20,13 +20,14 @@ class PartitionStateTest {
 
     ModelUtils mu = new ModelUtils(new PCModuleTestEnv());
 
+    TopicPartition tp = new TopicPartition("topic", 0);
+
     /**
      * @see PartitionState#maybeTruncateBelow
      */
     // parameter test with offsets closer together to check off by one
     @Test
     void bootstrapTruncation() {
-        TopicPartition tp = new TopicPartition("topic", 0);
         long unexpectedlyHighOffset = 20L;
         final long previouslyCommittedOffset = 11L;
         List<Long> incompletes = UniLists.of(previouslyCommittedOffset, 15L, unexpectedlyHighOffset, 60L, 80L);
@@ -42,7 +43,7 @@ void bootstrapTruncation() {
         var w20 = mu.createWorkFor(unexpectedlyHighOffset);
 
         // bootstrap the first record, triggering truncation - it's offset #unexpectedlyHighOffset, but we were expecting #previouslyCommittedOffset
-        state.addWorkContainer(w20);
+        state.addNewIncompleteWorkContainer(w20);
 
 
         Truth.assertThat(state.getNextExpectedInitialPolledOffset()).isEqualTo(unexpectedlyHighOffset);
@@ -51,4 +52,12 @@ void bootstrapTruncation() {
 
     }
 
+    /**
+     * test for offset gaps in partition data (i.e. compacted topics)
+     */
+    void compactedTopic() {
+        Truth.assertThat(true).isFalse();
+    }
+
+
 }
\ No newline at end of file

From f58c46721edbe50bf0be143cfe43f87ed5a6056d Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 1 Oct 2022 21:08:22 +0100
Subject: [PATCH 077/131] fixup! review

---
 .../io/confluent/parallelconsumer/state/PartitionStateTest.java | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
index 499e81718..d8165986e 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -25,7 +25,7 @@ class PartitionStateTest {
     /**
      * @see PartitionState#maybeTruncateBelow
      */
-    // parameter test with offsets closer together to check off by one
+    // todo parameter test with offsets closer together to check off by one
     @Test
     void bootstrapTruncation() {
         long unexpectedlyHighOffset = 20L;

From 000969c8ee770d7d5a54481b8003abaa04ba5f0f Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 1 Oct 2022 21:09:18 +0100
Subject: [PATCH 078/131] Revert "step - continuous checking and restructure"

This reverts commit 23c289f4
---
 .../io/confluent/csid/utils/JavaUtils.java    | 10 +--
 .../state/PartitionState.java                 |  3 +-
 .../state/PartitionStateManager.java          | 63 +++++--------------
 3 files changed, 19 insertions(+), 57 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
index 37e56237d..bba786ed7 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
@@ -20,13 +20,9 @@
 @UtilityClass
 public class JavaUtils {
 
-    public static <T> Optional<T> getLast(final List<T> someList) {
-        if (someList.isEmpty()) return Optional.empty();
-        return Optional.of(someList.get(someList.size() - 1));
-    }
-
-    public static <T> Optional<T> getFirst(final List<T> someList) {
-        return someList.isEmpty() ? Optional.empty() : Optional.of(someList.get(0));
+    public static <T> Optional<T> getLast(final List<T> commitHistory) {
+        if (commitHistory.isEmpty()) return Optional.empty();
+        return Optional.of(commitHistory.get(commitHistory.size() - 1));
     }
 
     public static <T> Optional<T> getOnlyOne(final Map<String, T> stringMapMap) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index e84891753..9588c6981 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -233,7 +233,7 @@ public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
 //        if (noWorkAddedYet) {
 //            noWorkAddedYet = false;
 //            long bootstrapOffset = wc.offset();
-//        maybeTruncateBelow(newOffset);
+        maybeTruncateBelow(newOffset);
 //        }
 
         maybeRaiseHighestSeenOffset(newOffset);
@@ -429,6 +429,5 @@ public void onPartitionsRemoved(ShardManager<K, V> sm) {
     public boolean isBlocked() {
         return !isAllowedMoreRecords();
     }
-
 }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 03c6a25f5..f9f00670c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -6,7 +6,6 @@
 
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import io.confluent.parallelconsumer.internal.*;
-import io.confluent.parallelconsumer.internal.EpochAndRecordsMap.RecordsAndEpoch;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
 import lombok.Getter;
 import lombok.NonNull;
@@ -22,8 +21,6 @@
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.stream.Collectors;
 
-import static io.confluent.csid.utils.JavaUtils.getFirst;
-import static io.confluent.csid.utils.JavaUtils.getLast;
 import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
 
 /**
@@ -246,7 +243,6 @@ boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
         return false;
     }
 
-    // todo move to partition state
     public boolean isRecordPreviouslyCompleted(ConsumerRecord<K, V> rec) {
         var tp = toTopicPartition(rec);
         var partitionState = getPartitionState(tp);
@@ -313,7 +309,6 @@ public boolean isBlocked(final TopicPartition topicPartition) {
         return !isAllowedMoreRecords(topicPartition);
     }
 
-    // todo move to partition state
     public boolean isPartitionRemovedOrNeverAssigned(ConsumerRecord<?, ?> rec) {
         TopicPartition topicPartition = toTopicPartition(rec);
         var partitionState = getPartitionState(topicPartition);
@@ -338,12 +333,10 @@ public void onFailure(WorkContainer<K, V> wc) {
     void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
         log.debug("Incoming {} new records...", recordsMap.count());
         for (var partition : recordsMap.partitions()) {
-            RecordsAndEpoch recordsList = recordsMap.records(partition);
+            var recordsList = recordsMap.records(partition);
             long epochOfInboundRecords = recordsList.getEpochOfPartitionAtPoll();
-            List<ConsumerRecord<K, V>> recordPollBatch = recordsList.getRecords();
-            if (!recordPollBatch.isEmpty()) {
-                // should always not be empty, but...
-                maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordsList);
+            for (var rec : recordsList.getRecords()) {
+                maybeRegisterNewRecordAsWork(epochOfInboundRecords, rec);
             }
         }
     }
@@ -351,52 +344,26 @@ void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
     /**
      * @see #maybeRegisterNewRecordAsWork(EpochAndRecordsMap)
      */
-    // todo move into PartitionState
-    // todo too deep
-    private void maybeRegisterNewRecordAsWork(@NonNull Long epochOfInboundRecords, @NonNull RecordsAndEpoch recordsList) {
-        List<ConsumerRecord<K, V>> recordPollBatch = recordsList.getRecords();
-
-        if (!recordPollBatch.isEmpty()) {
-            final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
-            //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-            ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
-            long batchStartOffset = sampleRecord.offset();
-
-            // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
-            var currentPartitionEpoch = getEpochOfPartitionForRecord(sampleRecord);
-            if (Objects.equals(epochOfInboundRecords, currentPartitionEpoch)) {
-
-                // todo move to partition state from here, as epoch apparently has to be tracked in PSM
-                if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
-                    log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(sampleRecord), sampleRecord);
-                } else {
-                    //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-                    long batchEndOffset = getLast(recordPollBatch).get().offset(); // NOSONAR
+    private void maybeRegisterNewRecordAsWork(@NonNull Long epochOfInboundRecords, @NonNull ConsumerRecord<K, V> rec) {
+        // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
+        var currentPartitionEpoch = getEpochOfPartitionForRecord(rec);
+        if (Objects.equals(epochOfInboundRecords, currentPartitionEpoch)) {
 
-                    TopicPartition partition = new TopicPartition(sampleRecord.topic(), sampleRecord.partition());
-                    getPartitionState(partition).maybeTruncate(batchStartOffset, batchEndOffset);
-
-                    maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
-                }
-            } else {
-                log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
-                        epochOfInboundRecords, currentPartitionEpoch);
+            if (isPartitionRemovedOrNeverAssigned(rec)) {
+                log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(rec), rec);
             }
-        }
-    }
 
-    // todo move to partition state
-    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
-        for (var aRecord : recordPollBatch) {
-            if (isRecordPreviouslyCompleted(aRecord)) {
-                log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
+            if (isRecordPreviouslyCompleted(rec)) {
+                log.trace("Record previously completed, skipping. offset: {}", rec.offset());
             } else {
-                //noinspection ObjectAllocationInLoop
-                var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
+                var work = new WorkContainer<>(epochOfInboundRecords, rec, module);
 
                 sm.addWorkContainer(work);
                 addNewIncompleteWorkContainer(work);
             }
+        } else {
+            log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
+                    epochOfInboundRecords, currentPartitionEpoch);
         }
     }
 

From b4af22a6d641658e74a2a45d96e8b202b9dfdadb Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 1 Oct 2022 21:31:18 +0100
Subject: [PATCH 079/131] clean up tangents, clarify

---
 .../io/confluent/csid/utils/JavaUtils.java    | 10 +++-
 .../state/PartitionState.java                 | 57 +++++++++++--------
 .../state/PartitionStateTest.java             |  3 +-
 3 files changed, 40 insertions(+), 30 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
index bba786ed7..37e56237d 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
@@ -20,9 +20,13 @@
 @UtilityClass
 public class JavaUtils {
 
-    public static <T> Optional<T> getLast(final List<T> commitHistory) {
-        if (commitHistory.isEmpty()) return Optional.empty();
-        return Optional.of(commitHistory.get(commitHistory.size() - 1));
+    public static <T> Optional<T> getLast(final List<T> someList) {
+        if (someList.isEmpty()) return Optional.empty();
+        return Optional.of(someList.get(someList.size() - 1));
+    }
+
+    public static <T> Optional<T> getFirst(final List<T> someList) {
+        return someList.isEmpty() ? Optional.empty() : Optional.of(someList.get(0));
     }
 
     public static <T> Optional<T> getOnlyOne(final Map<String, T> stringMapMap) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 9588c6981..1d81a820c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -81,10 +81,10 @@ public class PartitionState<K, V> {
      * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
      *         storage
      */
-    private ConcurrentSkipListSet<Long> incompleteOffsets;
+    private NavigableSet<Long> incompleteOffsets;
 
     /**
-     * Marker for the first record to be tracked. Used for some initial analysis.
+     * Marks whether any {@link WorkContainer}s have been added yet or not. Used for some initial analysis.
      */
     private boolean noWorkAddedYet = true;
 
@@ -140,11 +140,15 @@ public class PartitionState<K, V> {
      * Concurrent because either the broker poller thread or the control thread may be requesting offset to commit
      * ({@link #getCommitDataIfDirty()}), or reading upon {@link #onPartitionsRemoved}. This requirement is removed in
      * the upcoming PR #200 Refactor: Consider a shared nothing * architecture.
+     *
+     * @deprecated the map structure isn't used anymore and can be replaced with the offsets tracked in
+     *         {@link #incompleteOffsets}
      */
     // todo rename - it's not a queue of things to be committed - it's a collection of incomplete offsets and their WorkContainers
     // todo delete? seems this can be replaced by #incompletes - the work container info isn't used
     @ToString.Exclude
-    private final NavigableMap<Long, WorkContainer<K, V>> commitQueue = new ConcurrentSkipListMap<>();
+    @Deprecated
+    private NavigableMap<Long, WorkContainer<K, V>> commitQueue = new ConcurrentSkipListMap<>();
 
     private NavigableMap<Long, WorkContainer<K, V>> getCommitQueue() {
         return Collections.unmodifiableNavigableMap(commitQueue);
@@ -230,11 +234,7 @@ private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
     public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
 
-//        if (noWorkAddedYet) {
-//            noWorkAddedYet = false;
-//            long bootstrapOffset = wc.offset();
         maybeTruncateBelow(newOffset);
-//        }
 
         maybeRaiseHighestSeenOffset(newOffset);
         commitQueue.put(newOffset, wc);
@@ -246,31 +246,38 @@ public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
     /**
      * If the offset is higher than expected, according to the previously committed / polled offset, truncate up to it.
      * Offsets between have disappeared and will never be polled again.
+     * <p>
+     * Only runs if this is the first {@link WorkContainer} to be added since instantiation.
      */
     private void maybeTruncateBelow(long polledOffset) {
-        long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
-        boolean bootstrapRecordAboveExpected = polledOffset > nextExpectedPolledOffset;
-        if (bootstrapRecordAboveExpected) {
-            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'", polledOffset, nextExpectedPolledOffset);
-            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(polledOffset);
-            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
-            this.incompleteOffsets = wrapped;
+        if (noWorkAddedYet) {
+            noWorkAddedYet = false;
+            log.trace("Not bootstrap polled records, so not checking for truncation");
+            return;
         }
 
-        this.nextExpectedPolledOffset = polledOffset + 1;
-    }
+        long expectedBootstrapRecordOffset = this.getNextExpectedPolledOffset();
+
+        boolean bootstrapPolledRecordAboveExpected = polledOffset > expectedBootstrapRecordOffset;
 
-    public void maybeTruncate(long batchStartOffset, long batchEndOffset) {
-        long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
-        boolean bootstrapRecordAboveExpected = batchStartOffset > nextExpectedPolledOffset;
-        if (bootstrapRecordAboveExpected) {
-            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'", batchStartOffset, nextExpectedPolledOffset);
-            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(batchStartOffset);
-            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
-            this.incompleteOffsets = wrapped;
+        if (bootstrapPolledRecordAboveExpected) {
+            log.debug("Truncating state - removing records lower than {}. Offsets have been removed form the partition by the broker. Bootstrap polled {} but " +
+                            "expected {} from loaded commit data- e.g. record retention expiring, with 'auto.offset.reset'",
+                    polledOffset,
+                    polledOffset,
+                    expectedBootstrapRecordOffset);
+
+            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(polledOffset, true);
+//            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
+//            this.incompleteOffsets = wrapped;
+            this.incompleteOffsets = truncatedIncompletes;
+
+
+            NavigableMap<Long, WorkContainer<K, V>> truncatedQueue = commitQueue.tailMap(polledOffset, true);
+            this.commitQueue = truncatedQueue;
         }
 
-        this.nextExpectedPolledOffset = batchEndOffset + 1;
+        this.nextExpectedPolledOffset = polledOffset + 1;
     }
 
     private long nextExpectedPolledOffset = KAFKA_OFFSET_ABSENCE;
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
index d8165986e..44496726e 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -53,11 +53,10 @@ void bootstrapTruncation() {
     }
 
     /**
-     * test for offset gaps in partition data (i.e. compacted topics)
+     * Test for offset gaps in partition data (i.e. compacted topics)
      */
     void compactedTopic() {
         Truth.assertThat(true).isFalse();
     }
 
-
 }
\ No newline at end of file

From 26ee4b8b0e3228a0c05ee2f590752aa447c14978 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 4 Oct 2022 11:57:26 -0500
Subject: [PATCH 080/131] pruneRemovedTrackedIncompleteOffsets and detect
 committed offset reset earlier

---
 .../internal/EpochAndRecordsMap.java          |  3 +-
 .../state/PartitionState.java                 | 59 ++++++++++++++++---
 .../state/PartitionStateManager.java          | 15 ++++-
 3 files changed, 66 insertions(+), 11 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java
index 1edfa3ab9..1ad4f6aa0 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java
@@ -27,7 +27,7 @@ public EpochAndRecordsMap(ConsumerRecords<K, V> poll, PartitionStateManager<K, V
         poll.partitions().forEach(partition -> {
             var records = poll.records(partition);
             Long epochOfPartition = pm.getEpochOfPartition(partition);
-            RecordsAndEpoch entry = new RecordsAndEpoch(epochOfPartition, records);
+            RecordsAndEpoch entry = new RecordsAndEpoch(partition, epochOfPartition, records);
             recordMap.put(partition, entry);
         });
     }
@@ -63,6 +63,7 @@ public int count() {
 
     @Value
     public class RecordsAndEpoch {
+        @NonNull TopicPartition topicPartition;
         @NonNull Long epochOfPartitionAtPoll;
         @NonNull List<ConsumerRecord<K, V>> records;
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 1d81a820c..a1c61e2a3 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -5,6 +5,7 @@
  */
 
 import io.confluent.parallelconsumer.internal.BrokerPollSystem;
+import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import io.confluent.parallelconsumer.offsets.NoEncodingPossibleException;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
 import lombok.Getter;
@@ -20,6 +21,8 @@
 import java.util.concurrent.ConcurrentSkipListSet;
 import java.util.stream.Collectors;
 
+import static io.confluent.csid.utils.JavaUtils.getFirst;
+import static io.confluent.csid.utils.JavaUtils.getLast;
 import static io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.DefaultMaxMetadataSize;
 import static java.util.Optional.empty;
 import static java.util.Optional.of;
@@ -260,21 +263,28 @@ private void maybeTruncateBelow(long polledOffset) {
 
         boolean bootstrapPolledRecordAboveExpected = polledOffset > expectedBootstrapRecordOffset;
 
+        boolean bootstrapPolledRecordBelowExpected = polledOffset < expectedBootstrapRecordOffset;
+
         if (bootstrapPolledRecordAboveExpected) {
+            // previously committed offset has been removed, or manual reset to higher offset detected
             log.debug("Truncating state - removing records lower than {}. Offsets have been removed form the partition by the broker. Bootstrap polled {} but " +
                             "expected {} from loaded commit data- e.g. record retention expiring, with 'auto.offset.reset'",
                     polledOffset,
                     polledOffset,
                     expectedBootstrapRecordOffset);
 
-            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(polledOffset, true);
-//            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
-//            this.incompleteOffsets = wrapped;
-            this.incompleteOffsets = truncatedIncompletes;
-
+            this.incompleteOffsets = incompleteOffsets.tailSet(polledOffset, true);
+            this.commitQueue = commitQueue.tailMap(polledOffset, true);
+        } else if (bootstrapPolledRecordBelowExpected) {
+            // manual reset to lower offset detected
+            log.debug("CG offset has been reset to an earlier offset ({}) - truncating state - all records inclusively above will be replayed. Expecting {} but bootstrap poll was {}.",
+                    polledOffset,
+                    expectedBootstrapRecordOffset,
+                    polledOffset
+            );
 
-            NavigableMap<Long, WorkContainer<K, V>> truncatedQueue = commitQueue.tailMap(polledOffset, true);
-            this.commitQueue = truncatedQueue;
+            this.incompleteOffsets = new ConcurrentSkipListSet<>();
+            this.commitQueue = new ConcurrentSkipListMap<>();
         }
 
         this.nextExpectedPolledOffset = polledOffset + 1;
@@ -436,5 +446,40 @@ public void onPartitionsRemoved(ShardManager<K, V> sm) {
     public boolean isBlocked() {
         return !isAllowedMoreRecords();
     }
+
+    /**
+     * Each time we poll a patch of records, check to see that as expected our tracked incomplete offsets exist in the
+     * set, otherwise they must have been removed from the underlying partition and should be removed from our tracking
+     * as we'll ever be given the record again to retry.
+     */
+    @SuppressWarnings("OptionalGetWithoutIsPresent") // checked with isEmpty
+    protected void pruneRemovedTrackedIncompleteOffsets(EpochAndRecordsMap<?, ?>.RecordsAndEpoch polledRecordBatch) {
+        var records = polledRecordBatch.getRecords();
+
+        if (records.isEmpty()) {
+            log.warn("Polled an emtpy batch of records? {}", polledRecordBatch);
+            return;
+        }
+
+        var offsetLookup = records.stream()
+                .map(ConsumerRecord::offset)
+                .collect(Collectors.toSet());
+
+        var low = getFirst(records).get().offset(); // NOSONAR see #isEmpty
+        var high = getLast(records).get().offset(); // NOSONAR see #isEmpty
+
+        // for the incomplete offsets within this range of poll batch
+        var subsetFromBatchRange = incompleteOffsets.subSet(low, true, high, true);
+
+        for (long offset : subsetFromBatchRange) {
+            boolean offsetMissingFromPolledRecords = !offsetLookup.contains(offset);
+            if (offsetMissingFromPolledRecords) {
+                // offset has been removed from partition, so remove from tracking as it will never be sent to be retried
+                boolean removed = incompleteOffsets.remove(offset);
+                assert removed;
+            }
+        }
+    }
+
 }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index f9f00670c..e9e180600 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -22,6 +22,7 @@
 import java.util.stream.Collectors;
 
 import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
+import static io.confluent.csid.utils.StringUtils.msg;
 
 /**
  * In charge of managing {@link PartitionState}s.
@@ -77,6 +78,10 @@ public PartitionState<K, V> getPartitionState(TopicPartition tp) {
         return partitionStates.get(tp);
     }
 
+    private PartitionState<K, V> getPartitionState(EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsList) {
+        return getPartitionState(recordsList.getTopicPartition());
+    }
+
     /**
      * Load offset map for assigned assignedPartitions
      */
@@ -333,9 +338,13 @@ public void onFailure(WorkContainer<K, V> wc) {
     void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
         log.debug("Incoming {} new records...", recordsMap.count());
         for (var partition : recordsMap.partitions()) {
-            var recordsList = recordsMap.records(partition);
-            long epochOfInboundRecords = recordsList.getEpochOfPartitionAtPoll();
-            for (var rec : recordsList.getRecords()) {
+            var polledRecordBatch = recordsMap.records(partition);
+
+            var partitionState = getPartitionState(polledRecordBatch);
+            partitionState.pruneRemovedTrackedIncompleteOffsets(polledRecordBatch);
+
+            long epochOfInboundRecords = polledRecordBatch.getEpochOfPartitionAtPoll();
+            for (var rec : polledRecordBatch.getRecords()) {
                 maybeRegisterNewRecordAsWork(epochOfInboundRecords, rec);
             }
         }

From 87dd82e524b7b2a4116768c608d7b7820f9dfd0c Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 4 Oct 2022 21:58:19 -0500
Subject: [PATCH 081/131] test scenarios

---
 ...=> PartitionStateCommittedOffsetTest.java} | 22 ++++++++++++++++++-
 1 file changed, 21 insertions(+), 1 deletion(-)
 rename parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/{PartitionStateTest.java => PartitionStateCommittedOffsetTest.java} (77%)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
similarity index 77%
rename from parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
rename to parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index 44496726e..7ce67500d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -16,7 +16,7 @@
 import java.util.Optional;
 import java.util.stream.Collectors;
 
-class PartitionStateTest {
+class PartitionStateCommittedOffsetTest {
 
     ModelUtils mu = new ModelUtils(new PCModuleTestEnv());
 
@@ -59,4 +59,24 @@ void compactedTopic() {
         Truth.assertThat(true).isFalse();
     }
 
+    /**
+     * CG offset has been changed to a lower offset (partition rewind / replay) (metdata lost?)
+     */
+    void committedOffsetLower() {
+    }
+
+    /**
+     * CG offset has been changed to something higher than expected (offset skip) (metdata lost?)
+     */
+    void committedOffsetHigher() {
+    }
+
+    /**
+     * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
+     * with a higher offset than expected. Could be caused by retention period, or compaction.
+     */
+    void committedOffsetRemoved() {
+    }
+
+
 }
\ No newline at end of file

From 5c41b3feba9a3cdaaac62faf8f56f870fce8a956 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 5 Oct 2022 08:30:55 -0500
Subject: [PATCH 082/131] tests

---
 .../PartitionStateCommittedOffsetIT.java      | 52 +++++++++++
 .../parallelconsumer/state/ModelUtils.java    |  1 +
 .../PartitionStateCommittedOffsetTest.java    | 92 ++++++++++++++++---
 .../state/PolledTestBatch.java                | 58 ++++++++++++
 4 files changed, 191 insertions(+), 12 deletions(-)
 create mode 100644 parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
 create mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
new file mode 100644
index 000000000..9871a4118
--- /dev/null
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -0,0 +1,52 @@
+package io.confluent.parallelconsumer.integrationTests.state;
+
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
+import io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest;
+import org.apache.kafka.clients.admin.AdminClient;
+import org.apache.kafka.common.TopicPartition;
+
+class PartitionStateCommittedOffsetIT extends BrokerIntegrationTest<String, String> {
+
+    AdminClient ac;
+
+    String groupId = getKcu().getConsumer().groupMetadata().groupId();
+
+    TopicPartition tp = new TopicPartition("topic", 0);
+
+    /**
+     * Test for offset gaps in partition data (i.e. compacted topics)
+     */
+    void compactedTopic() {
+
+    }
+
+    /**
+     * CG offset has been changed to a lower offset (partition rewind / replay) (metdata lost?)
+     */
+    void committedOffsetLower() {
+//        ac.alterConsumerGroupOffsets(groupId, )
+    }
+
+    /**
+     * CG offset has been changed to something higher than expected (offset skip) (metdata lost?)
+     */
+    void committedOffsetHigher() {
+    }
+
+    /**
+     * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
+     * with a higher offset than expected. Could be caused by retention period, or compaction.
+     */
+    void committedOffsetRemoved() {
+    }
+
+    void cgOffsetsDeleted() {
+//        ac.deleteConsumerGroupOffsets()
+
+    }
+
+
+}
\ No newline at end of file
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
index a3ecd025f..36e56af8c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
@@ -24,6 +24,7 @@
 @RequiredArgsConstructor
 public class ModelUtils {
 
+    @Getter
     private final PCModuleTestEnv module;
 
     public WorkContainer<String, String> createWorkFor(long offset) {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index 7ce67500d..99c683ce6 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -5,8 +5,12 @@
  */
 
 import com.google.common.truth.Truth;
+import io.confluent.csid.utils.Range;
+import io.confluent.parallelconsumer.ManagedTruth;
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
+import org.apache.kafka.clients.admin.AdminClient;
+import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 import org.junit.jupiter.api.Test;
 import pl.tlinkowski.unij.api.UniLists;
@@ -18,28 +22,34 @@
 
 class PartitionStateCommittedOffsetTest {
 
+    AdminClient ac;
+
     ModelUtils mu = new ModelUtils(new PCModuleTestEnv());
 
     TopicPartition tp = new TopicPartition("topic", 0);
 
+    long unexpectedlyHighOffset = 20L;
+
+    final long previouslyCommittedOffset = 11L;
+
+    List<Long> incompletes = UniLists.of(previouslyCommittedOffset, 15L, unexpectedlyHighOffset, 60L, 80L);
+
+    List<Long> expectedTruncatedIncompletes = incompletes.stream()
+            .filter(offset -> offset >= unexpectedlyHighOffset)
+            .collect(Collectors.toList());
+
+    final long highestSeenOffset = 100L;
+
+    HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(highestSeenOffset), new HashSet<>(incompletes));
+
     /**
      * @see PartitionState#maybeTruncateBelow
      */
     // todo parameter test with offsets closer together to check off by one
     @Test
     void bootstrapTruncation() {
-        long unexpectedlyHighOffset = 20L;
-        final long previouslyCommittedOffset = 11L;
-        List<Long> incompletes = UniLists.of(previouslyCommittedOffset, 15L, unexpectedlyHighOffset, 60L, 80L);
-        List<Long> expectedTruncatedIncompletes = incompletes.stream()
-                .filter(offset -> offset >= unexpectedlyHighOffset)
-                .collect(Collectors.toList());
-
-        HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(100L), new HashSet<>(incompletes)); // todo fix set/list
-
         PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
 
-
         var w20 = mu.createWorkFor(unexpectedlyHighOffset);
 
         // bootstrap the first record, triggering truncation - it's offset #unexpectedlyHighOffset, but we were expecting #previouslyCommittedOffset
@@ -55,27 +65,85 @@ void bootstrapTruncation() {
     /**
      * Test for offset gaps in partition data (i.e. compacted topics)
      */
+    @Test
     void compactedTopic() {
-        Truth.assertThat(true).isFalse();
+
     }
 
     /**
      * CG offset has been changed to a lower offset (partition rewind / replay) (metdata lost?)
      */
+    @Test
     void committedOffsetLower() {
+        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+
+        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, highestSeenOffset);
+
+        //
+//        var psm = new PartitionStateManager<String, String>(mu.getModule(), mock(ShardManager.class));
+//        psm.onass
+//        psm.maybeRegisterNewRecordAsWork(polledTestBatch.polledRecordBatch);
+
+        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
+        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
+        for (var wc : polledTestBatch.polledBatchWCs) {
+            state.addNewIncompleteWorkContainer(wc);
+        }
+
+        //
+        OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
+
+        ManagedTruth.assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
+        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
     }
 
     /**
      * CG offset has been changed to something higher than expected (offset skip) (metdata lost?)
      */
-    void committedOffsetHigher() {
+    @Test
+    void bootstrapPollOffsetHigher() {
+        // committed state
+        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+
+        // bootstrap poll
+        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, highestSeenOffset);
+
+        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
+        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
+        for (var wc : polledTestBatch.polledBatchWCs) {
+            state.addNewIncompleteWorkContainer(wc);
+        }
+
+        //
+        OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
+
+        ManagedTruth.assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
+        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
     }
 
     /**
      * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
      * with a higher offset than expected. Could be caused by retention period, or compaction.
      */
+    @Test
     void committedOffsetRemoved() {
+        // committed state
+        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+
+        // bootstrap poll
+        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, highestSeenOffset);
+
+        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
+        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
+        for (var wc : polledTestBatch.polledBatchWCs) {
+            state.addNewIncompleteWorkContainer(wc);
+        }
+
+        //
+        OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
+
+        ManagedTruth.assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
+        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
     }
 
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
new file mode 100644
index 000000000..6b37920dd
--- /dev/null
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
@@ -0,0 +1,58 @@
+package io.confluent.parallelconsumer.state;
+
+import io.confluent.csid.utils.Range;
+import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.clients.consumer.ConsumerRecords;
+import org.apache.kafka.common.TopicPartition;
+import org.mockito.Mockito;
+import pl.tlinkowski.unij.api.UniMaps;
+
+import java.util.List;
+import java.util.stream.Collectors;
+
+import static org.mockito.Mockito.mock;
+
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
+public class PolledTestBatch {
+
+    final ModelUtils mu;
+
+    private final long highestSeenOffset;
+
+    private final TopicPartition tp;
+
+    List<WorkContainer<String, String>> polledBatchWCs;
+
+    List<ConsumerRecord<String, String>> polledBatch;
+
+    EpochAndRecordsMap<String, String> polledRecordBatch;
+
+    public PolledTestBatch(ModelUtils mu, TopicPartition tp, long toOffset) {
+        this.mu = mu;
+        this.tp = tp;
+        this.highestSeenOffset = toOffset;
+
+        create(tp, toOffset);
+    }
+
+    void create(TopicPartition tp, long highestSeenOffset) {
+        this.polledBatchWCs = Range.range(highestSeenOffset).toStream().boxed()
+                .map(offset -> mu.createWorkFor(offset))
+                .collect(Collectors.toList());
+        this.polledBatch = polledBatchWCs.stream()
+                .map(WorkContainer::getCr)
+                .collect(Collectors.toList());
+
+        ConsumerRecords<String, String> consumerRecords = new ConsumerRecords<>(UniMaps.of(tp, polledBatch));
+
+        PartitionStateManager<String, String> mock = mock(PartitionStateManager.class);
+        Mockito.when(mock.getEpochOfPartition(tp)).thenReturn(0L);
+        this.polledRecordBatch = new EpochAndRecordsMap<>(consumerRecords, mock);
+    }
+
+}

From 0a13ca692f30bdece9392139c9af780307448bfd Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 5 Oct 2022 22:47:10 -0500
Subject: [PATCH 083/131] issue #409 captured in test and fixed

---
 .../ParallelConsumerOptions.java              |  2 +
 .../state/PartitionState.java                 | 40 ++++++----
 .../PartitionStateCommittedOffsetTest.java    | 76 +++++++++++--------
 .../state/PolledTestBatch.java                | 14 ++--
 4 files changed, 79 insertions(+), 53 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
index 3105a291a..a26e4720e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
@@ -12,6 +12,7 @@
 import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerConfig;
 import org.apache.kafka.clients.producer.Producer;
+import org.apache.kafka.common.annotation.InterfaceStability;
 
 import java.time.Duration;
 import java.util.Objects;
@@ -31,6 +32,7 @@
 @Builder(toBuilder = true)
 @ToString
 @FieldNameConstants
+@InterfaceStability.Stable
 public class ParallelConsumerOptions<K, V> {
 
     /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index a1c61e2a3..a2f68f0da 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -89,7 +89,8 @@ public class PartitionState<K, V> {
     /**
      * Marks whether any {@link WorkContainer}s have been added yet or not. Used for some initial analysis.
      */
-    private boolean noWorkAddedYet = true;
+    // todo rename
+    private boolean bootstrapPhase = true;
 
     /**
      * Cache view of the state of the partition. Is set dirty when the incomplete state of any offset changes. Is set
@@ -113,6 +114,9 @@ public class PartitionState<K, V> {
      * <p>
      * Note that this may in some conditions, there may be a gap between this and the next offset to poll - that being,
      * there may be some number of transaction marker records above it, and the next offset to poll.
+     * <p>
+     * Note that as we only encode our offset map up to the highest succeeded offset (as encoding higher has no value),
+     * upon bootstrap, this will always start off as the same as the {@link #offsetHighestSeen}.
      */
     @Getter(PUBLIC)
     private long offsetHighestSucceeded = KAFKA_OFFSET_ABSENCE;
@@ -161,7 +165,7 @@ public PartitionState(TopicPartition tp, OffsetMapCodecManager.HighestOffsetAndI
         this.tp = tp;
         this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
         this.incompleteOffsets = new ConcurrentSkipListSet<>(offsetData.getIncompleteOffsets());
-        this.offsetHighestSucceeded = this.offsetHighestSeen;
+        this.offsetHighestSucceeded = this.offsetHighestSeen; // by definition, as we only encode up to the highest seen offset (inclusive)
         this.nextExpectedPolledOffset = getNextExpectedInitialPolledOffset();
     }
 
@@ -253,22 +257,25 @@ public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
      * Only runs if this is the first {@link WorkContainer} to be added since instantiation.
      */
     private void maybeTruncateBelow(long polledOffset) {
-        if (noWorkAddedYet) {
-            noWorkAddedYet = false;
+        if (!bootstrapPhase) {
             log.trace("Not bootstrap polled records, so not checking for truncation");
             return;
+        } else {
+            bootstrapPhase = false;
         }
 
-        long expectedBootstrapRecordOffset = this.getNextExpectedPolledOffset();
+//        long expectedBootstrapRecordOffset = this.getNextExpectedPolledOffset();
+        long expectedBootstrapRecordOffset = getNextExpectedInitialPolledOffset();
+
 
         boolean bootstrapPolledRecordAboveExpected = polledOffset > expectedBootstrapRecordOffset;
 
         boolean bootstrapPolledRecordBelowExpected = polledOffset < expectedBootstrapRecordOffset;
 
         if (bootstrapPolledRecordAboveExpected) {
-            // previously committed offset has been removed, or manual reset to higher offset detected
-            log.debug("Truncating state - removing records lower than {}. Offsets have been removed form the partition by the broker. Bootstrap polled {} but " +
-                            "expected {} from loaded commit data- e.g. record retention expiring, with 'auto.offset.reset'",
+            // previously committed offset record has been removed, or manual reset to higher offset detected
+            log.warn("Truncating state - removing records lower than {}. Offsets have been removed form the partition by the broker. Bootstrap polled {} but " +
+                            "expected {} from loaded commit data. Could be caused by record retention or compaction.",
                     polledOffset,
                     polledOffset,
                     expectedBootstrapRecordOffset);
@@ -277,7 +284,7 @@ private void maybeTruncateBelow(long polledOffset) {
             this.commitQueue = commitQueue.tailMap(polledOffset, true);
         } else if (bootstrapPolledRecordBelowExpected) {
             // manual reset to lower offset detected
-            log.debug("CG offset has been reset to an earlier offset ({}) - truncating state - all records inclusively above will be replayed. Expecting {} but bootstrap poll was {}.",
+            log.warn("CG offset has been reset to an earlier offset ({}) - truncating state - all records inclusively above will be replayed. Expecting {} but bootstrap poll was {}.",
                     polledOffset,
                     expectedBootstrapRecordOffset,
                     polledOffset
@@ -323,7 +330,8 @@ protected OffsetAndMetadata createOffsetAndMetadata() {
      * Defines as the offset one below the highest sequentially succeeded offset.
      */
     // visible for testing
-    protected long getNextExpectedInitialPolledOffset() {
+    // todo change back to protected? and enable protected level managed truth (seems to be limited to public)
+    public long getNextExpectedInitialPolledOffset() {
         return getOffsetHighestSequentialSucceeded() + 1;
     }
 
@@ -338,6 +346,7 @@ public Set<Long> getAllIncompleteOffsets() {
     /**
      * @return incomplete offsets which are lower than the highest succeeded
      */
+    // todo change from Set to List (order)
     public Set<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         long highestSucceeded = getOffsetHighestSucceeded();
         //noinspection FuseStreamOperations Collectors.toUnmodifiableSet since v10
@@ -474,9 +483,14 @@ protected void pruneRemovedTrackedIncompleteOffsets(EpochAndRecordsMap<?, ?>.Rec
         for (long offset : subsetFromBatchRange) {
             boolean offsetMissingFromPolledRecords = !offsetLookup.contains(offset);
             if (offsetMissingFromPolledRecords) {
-                // offset has been removed from partition, so remove from tracking as it will never be sent to be retried
-                boolean removed = incompleteOffsets.remove(offset);
-                assert removed;
+                log.warn("Offset {} has been removed from partition {} (as it's not been returned from a poll within a bounding batch), so it must be removed from tracking state, as it will never be sent again to be retried.",
+                        offset,
+                        getTp()
+                );
+                boolean removed1 = incompleteOffsets.remove(offset);
+                assert removed1;
+                boolean removed2 = commitQueue.remove(offset) != null;
+                assert removed2;
             }
         }
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index 99c683ce6..369b777b8 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -6,7 +6,6 @@
 
 import com.google.common.truth.Truth;
 import io.confluent.csid.utils.Range;
-import io.confluent.parallelconsumer.ManagedTruth;
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
 import org.apache.kafka.clients.admin.AdminClient;
@@ -20,6 +19,8 @@
 import java.util.Optional;
 import java.util.stream.Collectors;
 
+import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
+
 class PartitionStateCommittedOffsetTest {
 
     AdminClient ac;
@@ -30,16 +31,21 @@ class PartitionStateCommittedOffsetTest {
 
     long unexpectedlyHighOffset = 20L;
 
-    final long previouslyCommittedOffset = 11L;
+    long previouslyCommittedOffset = 11L;
+
+    final long highestSeenOffset = 101L;
 
-    List<Long> incompletes = UniLists.of(previouslyCommittedOffset, 15L, unexpectedlyHighOffset, 60L, 80L);
+    /**
+     * @see PartitionState#offsetHighestSucceeded
+     */
+    long highestSucceeded = highestSeenOffset;
+
+    List<Long> incompletes = UniLists.of(previouslyCommittedOffset, 15L, unexpectedlyHighOffset, 60L, 80L, 95L, 96L, 97L, 98L, 100L);
 
     List<Long> expectedTruncatedIncompletes = incompletes.stream()
             .filter(offset -> offset >= unexpectedlyHighOffset)
             .collect(Collectors.toList());
 
-    final long highestSeenOffset = 100L;
-
     HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(highestSeenOffset), new HashSet<>(incompletes));
 
     /**
@@ -47,15 +53,13 @@ class PartitionStateCommittedOffsetTest {
      */
     // todo parameter test with offsets closer together to check off by one
     @Test
-    void bootstrapTruncation() {
+    void bootstrapPollOffsetHigherDueToRentention() {
         PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
 
-        var w20 = mu.createWorkFor(unexpectedlyHighOffset);
-
         // bootstrap the first record, triggering truncation - it's offset #unexpectedlyHighOffset, but we were expecting #previouslyCommittedOffset
-        state.addNewIncompleteWorkContainer(w20);
-
+        addPollToState(state, new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset));
 
+        //
         Truth.assertThat(state.getNextExpectedInitialPolledOffset()).isEqualTo(unexpectedlyHighOffset);
 
         Truth.assertThat(state.getIncompleteOffsetsBelowHighestSucceeded()).containsExactlyElementsIn(expectedTruncatedIncompletes);
@@ -77,73 +81,79 @@ void compactedTopic() {
     void committedOffsetLower() {
         PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
 
-        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, highestSeenOffset);
+        long unexpectedLowerOffset = previouslyCommittedOffset - 5L;
+
+        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedLowerOffset, highestSeenOffset);
 
         //
 //        var psm = new PartitionStateManager<String, String>(mu.getModule(), mock(ShardManager.class));
 //        psm.onass
 //        psm.maybeRegisterNewRecordAsWork(polledTestBatch.polledRecordBatch);
 
-        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
-        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
-        for (var wc : polledTestBatch.polledBatchWCs) {
-            state.addNewIncompleteWorkContainer(wc);
-        }
+        addPollToState(state, polledTestBatch);
 
         //
         OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
 
-        ManagedTruth.assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
+        assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
         state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
     }
 
+    private void addPollToState(PartitionState<String, String> state, PolledTestBatch polledTestBatch) {
+        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
+        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
+        for (var wc : polledTestBatch.polledBatchWCs) {
+            // todo when PSM and PartitionState are refactored, this conditional should not be needed
+            if (!state.isRecordPreviouslyCompleted(wc.getCr())) {
+                state.addNewIncompleteWorkContainer(wc);
+            }
+        }
+    }
+
     /**
-     * CG offset has been changed to something higher than expected (offset skip) (metdata lost?)
+     * CG offset has been changed to something higher than expected (offset skip) (metadata lost?)
      */
     @Test
-    void bootstrapPollOffsetHigher() {
+    void bootstrapPollOffsetHigherViaManualCGRset() {
         // committed state
         PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
 
         // bootstrap poll
-        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, highestSeenOffset);
+        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset);
 
         // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
-        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
-        for (var wc : polledTestBatch.polledBatchWCs) {
-            state.addNewIncompleteWorkContainer(wc);
-        }
+        addPollToState(state, polledTestBatch);
 
         //
         OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
 
-        ManagedTruth.assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
+        assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
         state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
     }
 
     /**
      * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
      * with a higher offset than expected. Could be caused by retention period, or compaction.
+     *
+     * @implSpec issue #409: Committing old offset after OFFSET_OUT_OF_RANGE
      */
     @Test
-    void committedOffsetRemoved() {
+    void bootstrapPollOffsetHigherDueToRetentionOrCompaction() {
         // committed state
         PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
 
         // bootstrap poll
-        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, highestSeenOffset);
+        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset);
 
         // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
-        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
-        for (var wc : polledTestBatch.polledBatchWCs) {
-            state.addNewIncompleteWorkContainer(wc);
-        }
+        addPollToState(state, polledTestBatch);
 
         //
+        assertThat(state).getNextExpectedInitialPolledOffset().isEqualTo(unexpectedlyHighOffset);
         OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
 
-        ManagedTruth.assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
-        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
+        assertThat(offsetAndMetadata).getOffset().isEqualTo(unexpectedlyHighOffset);
+        assertThat(state).getAllIncompleteOffsets().containsExactlyElementsIn(expectedTruncatedIncompletes);
     }
 
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
index 6b37920dd..44ddfd64f 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
@@ -1,7 +1,7 @@
 package io.confluent.parallelconsumer.state;
 
-import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
+import one.util.streamex.LongStreamEx;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.clients.consumer.ConsumerRecords;
 import org.apache.kafka.common.TopicPartition;
@@ -32,18 +32,18 @@ public class PolledTestBatch {
 
     EpochAndRecordsMap<String, String> polledRecordBatch;
 
-    public PolledTestBatch(ModelUtils mu, TopicPartition tp, long toOffset) {
+    public PolledTestBatch(ModelUtils mu, TopicPartition tp, long fromOffset, long toOffset) {
         this.mu = mu;
         this.tp = tp;
         this.highestSeenOffset = toOffset;
 
-        create(tp, toOffset);
+        create(tp, fromOffset, toOffset);
     }
 
-    void create(TopicPartition tp, long highestSeenOffset) {
-        this.polledBatchWCs = Range.range(highestSeenOffset).toStream().boxed()
-                .map(offset -> mu.createWorkFor(offset))
-                .collect(Collectors.toList());
+    void create(TopicPartition tp, long fromOffset, long highestSeenOffset) {
+        this.polledBatchWCs = LongStreamEx.range(fromOffset, highestSeenOffset + 1).boxed()
+                .map(mu::createWorkFor)
+                .toList();
         this.polledBatch = polledBatchWCs.stream()
                 .map(WorkContainer::getCr)
                 .collect(Collectors.toList());

From d713b299f69b1a9b15c068f3fa615a52a830ccaf Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 5 Oct 2022 23:47:31 -0500
Subject: [PATCH 084/131] three scenarios captured and fixed

---
 .../state/PartitionState.java                 |  50 +++++---
 .../PartitionStateCommittedOffsetTest.java    | 112 ++++++++++--------
 .../state/PolledTestBatch.java                |  24 +++-
 3 files changed, 118 insertions(+), 68 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index a2f68f0da..8231b76c5 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -15,6 +15,7 @@
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
+import pl.tlinkowski.unij.api.UniSets;
 
 import java.util.*;
 import java.util.concurrent.ConcurrentSkipListMap;
@@ -163,6 +164,11 @@ private NavigableMap<Long, WorkContainer<K, V>> getCommitQueue() {
 
     public PartitionState(TopicPartition tp, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.tp = tp;
+
+        initState(offsetData);
+    }
+
+    private void initState(OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
         this.incompleteOffsets = new ConcurrentSkipListSet<>(offsetData.getIncompleteOffsets());
         this.offsetHighestSucceeded = this.offsetHighestSeen; // by definition, as we only encode up to the highest seen offset (inclusive)
@@ -241,7 +247,7 @@ private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
     public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
 
-        maybeTruncateBelow(newOffset);
+//        maybeTruncateBelowOrAbove(newOffset);
 
         maybeRaiseHighestSeenOffset(newOffset);
         commitQueue.put(newOffset, wc);
@@ -256,12 +262,12 @@ public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
      * <p>
      * Only runs if this is the first {@link WorkContainer} to be added since instantiation.
      */
-    private void maybeTruncateBelow(long polledOffset) {
-        if (!bootstrapPhase) {
-            log.trace("Not bootstrap polled records, so not checking for truncation");
-            return;
-        } else {
+    private void maybeTruncateBelowOrAbove(long polledOffset) {
+        if (bootstrapPhase) {
             bootstrapPhase = false;
+        } else {
+            // Not bootstrap phase anymore, so not checking for truncation
+            return;
         }
 
 //        long expectedBootstrapRecordOffset = this.getNextExpectedPolledOffset();
@@ -284,19 +290,22 @@ private void maybeTruncateBelow(long polledOffset) {
             this.commitQueue = commitQueue.tailMap(polledOffset, true);
         } else if (bootstrapPolledRecordBelowExpected) {
             // manual reset to lower offset detected
-            log.warn("CG offset has been reset to an earlier offset ({}) - truncating state - all records inclusively above will be replayed. Expecting {} but bootstrap poll was {}.",
+            log.warn("Bootstrap polled offset has been reset to an earlier offset ({}) - truncating state - all records above including this will be replayed. Was expecting {} but bootstrap poll was {}.",
                     polledOffset,
                     expectedBootstrapRecordOffset,
                     polledOffset
             );
-
-            this.incompleteOffsets = new ConcurrentSkipListSet<>();
-            this.commitQueue = new ConcurrentSkipListMap<>();
+            // reset state to the polled offset
+            // todo option to save incompletes data and only replay offsets between polled through to expected? (just replay the offsets of which we've moved backwards by)
+            initState(new OffsetMapCodecManager.HighestOffsetAndIncompletes(Optional.of(polledOffset - 1), UniSets.of()));
+//            this.incompleteOffsets = new ConcurrentSkipListSet<>();
+//            this.commitQueue = new ConcurrentSkipListMap<>();
         }
 
         this.nextExpectedPolledOffset = polledOffset + 1;
     }
 
+    // todo delete
     private long nextExpectedPolledOffset = KAFKA_OFFSET_ABSENCE;
 
     private long getNextExpectedPolledOffset() {
@@ -470,27 +479,34 @@ protected void pruneRemovedTrackedIncompleteOffsets(EpochAndRecordsMap<?, ?>.Rec
             return;
         }
 
-        var offsetLookup = records.stream()
+        var low = getFirst(records).get().offset(); // NOSONAR see #isEmpty
+
+        maybeTruncateBelowOrAbove(low);
+
+        // build the hash set once, so we can do random access checks of our tracked incompletes
+        var polledOffsetLookup = records.stream()
                 .map(ConsumerRecord::offset)
                 .collect(Collectors.toSet());
 
-        var low = getFirst(records).get().offset(); // NOSONAR see #isEmpty
         var high = getLast(records).get().offset(); // NOSONAR see #isEmpty
 
         // for the incomplete offsets within this range of poll batch
         var subsetFromBatchRange = incompleteOffsets.subSet(low, true, high, true);
 
         for (long offset : subsetFromBatchRange) {
-            boolean offsetMissingFromPolledRecords = !offsetLookup.contains(offset);
+            boolean offsetMissingFromPolledRecords = !polledOffsetLookup.contains(offset);
             if (offsetMissingFromPolledRecords) {
-                log.warn("Offset {} has been removed from partition {} (as it's not been returned from a poll within a bounding batch), so it must be removed from tracking state, as it will never be sent again to be retried.",
+                log.warn("Offset {} has been removed from partition {} (as it has not been returned within a polled batch which should have contained it - batch offset range is {} to {}), so it must be removed from tracking state, as it will never be sent again to be retried. This can be caused by PC rebalancing across a partition which has been compacted on offsets above the committed base offset, after initial load and before a rebalance.",
                         offset,
-                        getTp()
+                        getTp(),
+                        low,
+                        high
                 );
                 boolean removed1 = incompleteOffsets.remove(offset);
                 assert removed1;
-                boolean removed2 = commitQueue.remove(offset) != null;
-                assert removed2;
+                // can't remove it from a collection wit would have never been added to
+//                boolean removed2 = commitQueue.remove(offset) != null;
+//                assert removed2;
             }
         }
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index 369b777b8..6d5045188 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -4,23 +4,29 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
-import com.google.common.truth.Truth;
-import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
+import one.util.streamex.LongStreamEx;
 import org.apache.kafka.clients.admin.AdminClient;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 import org.junit.jupiter.api.Test;
 import pl.tlinkowski.unij.api.UniLists;
+import pl.tlinkowski.unij.api.UniSets;
 
 import java.util.HashSet;
 import java.util.List;
 import java.util.Optional;
+import java.util.Set;
 import java.util.stream.Collectors;
 
 import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
 
+/**
+ * @author Antony Stubbs
+ * @see PartitionState#maybeTruncateBelow
+ * @see PartitionState#pruneRemovedTrackedIncompleteOffsets
+ */
 class PartitionStateCommittedOffsetTest {
 
     AdminClient ac;
@@ -48,55 +54,59 @@ class PartitionStateCommittedOffsetTest {
 
     HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(highestSeenOffset), new HashSet<>(incompletes));
 
+    PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+
     /**
-     * @see PartitionState#maybeTruncateBelow
+     * Test for offset gaps in partition data (i.e. compacted topics)
      */
-    // todo parameter test with offsets closer together to check off by one
     @Test
-    void bootstrapPollOffsetHigherDueToRentention() {
-        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+    void compactedTopic() {
+        Set<Long> compacted = UniSets.of(80L, 95L, 97L);
+        long slightlyLowerRange = highestSeenOffset - 2L; // to check subsets don't mess with incompletes not represented in this polled batch
+        List<Long> polledOffsetsWithCompactedRemoved = LongStreamEx.range(previouslyCommittedOffset, slightlyLowerRange)
+                .filter(offset -> !compacted.contains(offset))
+                .boxed().toList();
 
-        // bootstrap the first record, triggering truncation - it's offset #unexpectedlyHighOffset, but we were expecting #previouslyCommittedOffset
-        addPollToState(state, new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset));
+        //
+        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, polledOffsetsWithCompactedRemoved);
 
         //
-        Truth.assertThat(state.getNextExpectedInitialPolledOffset()).isEqualTo(unexpectedlyHighOffset);
+        addPollToState(state, polledTestBatch);
 
-        Truth.assertThat(state.getIncompleteOffsetsBelowHighestSucceeded()).containsExactlyElementsIn(expectedTruncatedIncompletes);
+        //
+        OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
 
-    }
+        assertThat(offsetAndMetadata).getOffset().isEqualTo(previouslyCommittedOffset);
 
-    /**
-     * Test for offset gaps in partition data (i.e. compacted topics)
-     */
-    @Test
-    void compactedTopic() {
+        var compactedIncompletes = incompletes.stream().filter(offset -> !compacted.contains(offset)).collect(Collectors.toList());
+        assertThat(state).getAllIncompleteOffsets().containsExactlyElementsIn(compactedIncompletes);
 
+        // check still contains 100,101
     }
 
     /**
-     * CG offset has been changed to a lower offset (partition rewind / replay) (metdata lost?)
+     * CG offset has been changed to a lower offset (partition rewind / replay).
+     * <p>
+     * Metadata could be lost if it's a manual reset, otherwise it will still exist. If it's been lost, then we will
+     * bootstrap the partition as though it's the first time it's ever been seen, so nothing to do.
+     * <p>
+     * If the offset and metadata is still there, then we have to handle the situation.
      */
     @Test
     void committedOffsetLower() {
-        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
-
-        long unexpectedLowerOffset = previouslyCommittedOffset - 5L;
+        long randomlyChosenStepBackwards = 5L;
+        long unexpectedLowerOffset = previouslyCommittedOffset - randomlyChosenStepBackwards;
 
         PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedLowerOffset, highestSeenOffset);
 
         //
-//        var psm = new PartitionStateManager<String, String>(mu.getModule(), mock(ShardManager.class));
-//        psm.onass
-//        psm.maybeRegisterNewRecordAsWork(polledTestBatch.polledRecordBatch);
-
         addPollToState(state, polledTestBatch);
 
         //
         OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
 
-        assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
-        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
+        assertThat(offsetAndMetadata).getOffset().isEqualTo(unexpectedLowerOffset);
+        assertThat(state).getAllIncompleteOffsets().containsExactlyElementsIn(LongStreamEx.range(unexpectedLowerOffset, highestSeenOffset + 1).boxed().toList());
     }
 
     private void addPollToState(PartitionState<String, String> state, PolledTestBatch polledTestBatch) {
@@ -104,38 +114,44 @@ private void addPollToState(PartitionState<String, String> state, PolledTestBatc
         state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
         for (var wc : polledTestBatch.polledBatchWCs) {
             // todo when PSM and PartitionState are refactored, this conditional should not be needed
-            if (!state.isRecordPreviouslyCompleted(wc.getCr())) {
+            var offset = wc.offset();
+            final boolean notPreviouslyCompleted = !state.isRecordPreviouslyCompleted(wc.getCr());
+            if (notPreviouslyCompleted) {
                 state.addNewIncompleteWorkContainer(wc);
             }
         }
     }
-
-    /**
-     * CG offset has been changed to something higher than expected (offset skip) (metadata lost?)
-     */
-    @Test
-    void bootstrapPollOffsetHigherViaManualCGRset() {
-        // committed state
-        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
-
-        // bootstrap poll
-        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset);
-
-        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
-        addPollToState(state, polledTestBatch);
-
-        //
-        OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
-
-        assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
-        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
-    }
+//
+//    /**
+//     *
+//     */
+//    @Test
+//    void bootstrapPollOffsetHigherViaManualCGRset() {
+//        // committed state
+//        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+//
+//        // bootstrap poll
+//        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset);
+//
+//        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
+//        addPollToState(state, polledTestBatch);
+//
+//        //
+//        OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
+//
+//        assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
+//        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
+//    }
 
     /**
      * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
      * with a higher offset than expected. Could be caused by retention period, or compaction.
+     * <p>
+     * If the CG offset has been changed to something higher than expected manually, then we will bootstrap the
+     * partition as though it's never been seen before, so nothing to do.
      *
      * @implSpec issue #409: Committing old offset after OFFSET_OUT_OF_RANGE
+     * @see PartitionState#maybeTruncateBelow
      */
     @Test
     void bootstrapPollOffsetHigherDueToRetentionOrCompaction() {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
index 44ddfd64f..2749a4a1f 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
@@ -1,7 +1,9 @@
 package io.confluent.parallelconsumer.state;
 
+import io.confluent.csid.utils.JavaUtils;
 import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import one.util.streamex.LongStreamEx;
+import one.util.streamex.StreamEx;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.clients.consumer.ConsumerRecords;
 import org.apache.kafka.common.TopicPartition;
@@ -37,11 +39,27 @@ public PolledTestBatch(ModelUtils mu, TopicPartition tp, long fromOffset, long t
         this.tp = tp;
         this.highestSeenOffset = toOffset;
 
-        create(tp, fromOffset, toOffset);
+        create(fromOffset, toOffset);
     }
 
-    void create(TopicPartition tp, long fromOffset, long highestSeenOffset) {
-        this.polledBatchWCs = LongStreamEx.range(fromOffset, highestSeenOffset + 1).boxed()
+    public PolledTestBatch(ModelUtils mu, TopicPartition tp, List<Long> polledOffsetsWithCompactedRemoved) {
+        this.mu = mu;
+        this.tp = tp;
+        //noinspection OptionalGetWithoutIsPresent
+        this.highestSeenOffset = JavaUtils.getLast(polledOffsetsWithCompactedRemoved).get();
+
+        create(polledOffsetsWithCompactedRemoved);
+
+    }
+
+    void create(long fromOffset, long highestSeenOffset) {
+        List<Long> offsets = LongStreamEx.range(fromOffset, highestSeenOffset + 1).boxed().toList();
+        create(offsets);
+    }
+
+    void create(List<Long> offsets) {
+        var offsetStream = StreamEx.of(offsets);
+        this.polledBatchWCs = offsetStream
                 .map(mu::createWorkFor)
                 .toList();
         this.polledBatch = polledBatchWCs.stream()

From 3336746fd4f6657368430a94b9705f7720bc55db Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 6 Oct 2022 13:06:03 +0100
Subject: [PATCH 085/131] SAVE: fixing tests

---
 .../offsets/OffsetEncodingTests.java                | 13 ++++++++-----
 1 file changed, 8 insertions(+), 5 deletions(-)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
index 56aa02e8e..6cbed585e 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
@@ -31,6 +31,7 @@
 
 import static io.confluent.parallelconsumer.ManagedTruth.assertTruth;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.*;
+import static io.confluent.parallelconsumer.state.PartitionState.KAFKA_OFFSET_ABSENCE;
 import static org.assertj.core.api.Assertions.assertThat;
 import static org.hamcrest.Matchers.in;
 import static org.hamcrest.Matchers.not;
@@ -226,17 +227,19 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         {
             var newWm = new WorkManager<>(new PCModule<>(options));
             newWm.onPartitionsAssigned(UniSets.of(tp));
-            newWm.registerWork(new EpochAndRecordsMap(testRecords, newWm.getPm()));
+            newWm.registerWork(new EpochAndRecordsMap<>(testRecords, newWm.getPm()));
 
             var pm = newWm.getPm();
             var partitionState = pm.getPartitionState(tp);
 
             if (assumeWorkingCodec(encoding, encodingsThatFail)) {
-                long offsetHighestSequentialSucceeded = partitionState.getOffsetHighestSequentialSucceeded();
-                assertThat(offsetHighestSequentialSucceeded).isEqualTo(0);
+//                long offsetHighestSequentialSucceeded = partitionState.getOffsetHighestSequentialSucceeded();
+//                assertThat(offsetHighestSequentialSucceeded).isEqualTo(0);
+                assertTruth(partitionState).getOffsetHighestSequentialSucceeded().isEqualTo(KAFKA_OFFSET_ABSENCE);
 
-                long offsetHighestSucceeded = partitionState.getOffsetHighestSucceeded();
-                assertThat(offsetHighestSucceeded).isEqualTo(highest);
+//                long offsetHighestSucceeded = partitionState.getOffsetHighestSucceeded();
+//                assertThat(offsetHighestSucceeded).isEqualTo(highest);
+                assertTruth(partitionState).getOffsetHighestSucceeded().isEqualTo(highest);
 
                 long offsetHighestSeen = partitionState.getOffsetHighestSeen();
                 assertThat(offsetHighestSeen).isEqualTo(highest);

From 3014d8e45a1ad6e0604702e27dd485e86d2abcbe Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Sat, 1 Oct 2022 21:01:40 +0100
Subject: [PATCH 086/131] START: Refactor PSM and PS

---
 .../state/PartitionState.java                 | 146 ++++++++++++++
 .../state/PartitionStateManager.java          | 184 +++++++-----------
 2 files changed, 216 insertions(+), 114 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index e84891753..3c1c3d927 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -5,9 +5,11 @@
  */
 
 import io.confluent.parallelconsumer.internal.BrokerPollSystem;
+import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import io.confluent.parallelconsumer.offsets.NoEncodingPossibleException;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
 import lombok.Getter;
+import lombok.NonNull;
 import lombok.Setter;
 import lombok.ToString;
 import lombok.extern.slf4j.Slf4j;
@@ -20,6 +22,9 @@
 import java.util.concurrent.ConcurrentSkipListSet;
 import java.util.stream.Collectors;
 
+import static io.confluent.csid.utils.JavaUtils.getFirst;
+import static io.confluent.csid.utils.JavaUtils.getLast;
+import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
 import static io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.DefaultMaxMetadataSize;
 import static java.util.Optional.empty;
 import static java.util.Optional.of;
@@ -30,6 +35,7 @@
  *
  * @see PartitionStateManager
  */
+// todo class becoming large - possible to extract some functionality?
 @ToString
 @Slf4j
 public class PartitionState<K, V> {
@@ -40,6 +46,14 @@ public class PartitionState<K, V> {
      */
     public static final long KAFKA_OFFSET_ABSENCE = -1L;
 
+    /**
+     * Used for adding work to, if it's been successfully added to our tracked state
+     *
+     * @see #maybeRegisterNewRecordAsWork
+     */
+    @NonNull
+    private final ShardManager<K, V> sm;
+
     @Getter
     private final TopicPartition tp;
 
@@ -156,6 +170,7 @@ public PartitionState(TopicPartition tp, OffsetMapCodecManager.HighestOffsetAndI
         this.incompleteOffsets = new ConcurrentSkipListSet<>(offsetData.getIncompleteOffsets());
         this.offsetHighestSucceeded = this.offsetHighestSeen;
         this.nextExpectedPolledOffset = getNextExpectedInitialPolledOffset();
+        this.sm = null;
     }
 
     private void maybeRaiseHighestSeenOffset(final long offset) {
@@ -227,6 +242,72 @@ private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
         }
     }
 
+
+    public void maybeRegisterNewRecordsAsWork(@NonNull EpochAndRecordsMap.RecordsAndEpoch recordsAndEpoch) {
+        // todo move to partition state from here, as epoch apparently has to be tracked in PSM
+        var recordPollBatch = recordsAndEpoch.getRecords();
+        final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
+        //noinspection OptionalGetWithoutIsPresent -- already checked not empty
+        ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
+
+        // check epoch is ok
+        // move to method
+        // todo teach PartitionState to know it's Epoch, move this into PartitionState
+        {
+            final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
+            //noinspection OptionalGetWithoutIsPresent -- already checked not empty
+            ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
+            long batchStartOffset = sampleRecord.offset();
+
+            // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
+            var currentPartitionEpoch = getPartitionsAssignmentEpoch();
+            Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
+
+            boolean epochsDontMatch = !Objects.equals(epochOfInboundRecords, currentPartitionEpoch);
+            if (epochsDontMatch) {
+                log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
+                        epochOfInboundRecords, currentPartitionEpoch);
+                return;
+            }
+        }
+
+
+        if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
+            log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(sampleRecord), sampleRecord);
+        } else {
+            //noinspection OptionalGetWithoutIsPresent -- already checked not empty
+            long batchEndOffset = getLast(recordPollBatch).get().offset(); // NOSONAR
+
+            TopicPartition partition = new TopicPartition(sampleRecord.topic(), sampleRecord.partition());
+            partitionState.maybeTruncate(batchStartOffset, batchEndOffset);
+
+            maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
+        }
+    }
+
+    //    // todo move to partition state
+    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
+        for (var aRecord : recordPollBatch) {
+            if (isRecordPreviouslyCompleted(aRecord)) {
+                log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
+            } else {
+                //noinspection ObjectAllocationInLoop
+                var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
+
+                sm.addWorkContainer(work);
+                addNewIncompleteWorkContainer(work);
+            }
+        }
+    }
+
+    // todo move to partition state
+    public boolean isPartitionRemovedOrNeverAssigned(ConsumerRecord<?, ?> rec) {
+        TopicPartition topicPartition = toTopicPartition(rec);
+        var partitionState = getPartitionState(topicPartition);
+        boolean hasNeverBeenAssigned = partitionState == null;
+        return hasNeverBeenAssigned || partitionState.isRemoved();
+    }
+
     public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
 
@@ -430,5 +511,70 @@ public boolean isBlocked() {
         return !isAllowedMoreRecords();
     }
 
+
+    /**
+     * If the record is below the highest succeeded offset, then it is or will be represented in the current offset
+     * encoding.
+     * <p>
+     * This may in fact be THE message holding up the partition - so must be retried.
+     * <p>
+     * In which case - don't want to skip it.
+     * <p>
+     * Generally speaking, completing more offsets below the highest succeeded (and thus the set represented in the
+     * encoded payload), should usually reduce the payload size requirements.
+     */
+    private boolean isBlockingProgress(WorkContainer<?, ?> workContainer) {
+        return workContainer.offset() < getOffsetHighestSucceeded();
+    }
+
+    public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
+        if (checkIfWorkIsStale(workContainer)) {
+            log.debug("Work is in queue with stale epoch or no longer assigned. Skipping. Shard it came from will/was removed during partition revocation. WC: {}", workContainer);
+            return false;
+        } else if (isAllowedMoreRecords(workContainer)) {
+            return true;
+        } else if (isBlockingProgress(workContainer)) {
+            // allow record to be taken, even if partition is blocked, as this record completion may reduce payload size requirement
+            return true;
+        } else {
+            log.debug("Not allowed more records for the partition ({}) as set from previous encode run (blocked), that this " +
+                            "record ({}) belongs to, due to offset encoding back pressure, is within the encoded payload already (offset lower than highest succeeded, " +
+                            "not in flight ({}), continuing on to next container in shardEntry.",
+                    workContainer.getTopicPartition(), workContainer.offset(), workContainer.isNotInFlight());
+            return false;
+        }
+    }
+
+
+    /**
+     * Have our partitions been revoked?
+     * <p>
+     * This state is rare, as shards or work get removed upon partition revocation, although under busy load it might
+     * occur we don't synchronize over PartitionState here so it's a bit racey, but is handled and eventually settles.
+     *
+     * @return true if epoch doesn't match, false if ok
+     */
+    boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
+        var topicPartitionKey = workContainer.getTopicPartition();
+
+        Long currentPartitionEpoch = getPartitionsAssignmentEpoch();
+        long workEpoch = workContainer.getEpoch();
+
+        boolean partitionNotAssigned = isPartitionRemovedOrNeverAssigned(workContainer.getCr());
+
+        boolean epochMissMatch = currentPartitionEpoch != workEpoch;
+
+        if (epochMissMatch || partitionNotAssigned) {
+            log.debug("Epoch mismatch {} vs {} for record {}. Skipping message - it's partition has already assigned to a different consumer.",
+                    workEpoch, currentPartitionEpoch, workContainer);
+            return true;
+        }
+        return false;
+    }
+
+    private Long getPartitionsAssignmentEpoch() {
+        throw new RuntimeException();
+    }
+
 }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 03c6a25f5..0d2421146 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -22,8 +22,6 @@
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.stream.Collectors;
 
-import static io.confluent.csid.utils.JavaUtils.getFirst;
-import static io.confluent.csid.utils.JavaUtils.getLast;
 import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
 
 /**
@@ -220,40 +218,14 @@ private void incrementPartitionAssignmentEpoch(final Collection<TopicPartition>
         }
     }
 
-    /**
-     * Have our partitions been revoked?
-     * <p>
-     * This state is rare, as shards or work get removed upon partition revocation, although under busy load it might
-     * occur we don't synchronize over PartitionState here so it's a bit racey, but is handled and eventually settles.
-     *
-     * @return true if epoch doesn't match, false if ok
-     */
-    boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
-        var topicPartitionKey = workContainer.getTopicPartition();
-
-        Long currentPartitionEpoch = partitionsAssignmentEpochs.get(topicPartitionKey);
-        long workEpoch = workContainer.getEpoch();
-
-        boolean partitionNotAssigned = isPartitionRemovedOrNeverAssigned(workContainer.getCr());
-
-        boolean epochMissMatch = currentPartitionEpoch != workEpoch;
-
-        if (epochMissMatch || partitionNotAssigned) {
-            log.debug("Epoch mismatch {} vs {} for record {}. Skipping message - it's partition has already assigned to a different consumer.",
-                    workEpoch, currentPartitionEpoch, workContainer);
-            return true;
-        }
-        return false;
-    }
-
-    // todo move to partition state
-    public boolean isRecordPreviouslyCompleted(ConsumerRecord<K, V> rec) {
-        var tp = toTopicPartition(rec);
-        var partitionState = getPartitionState(tp);
-        boolean previouslyCompleted = partitionState.isRecordPreviouslyCompleted(rec);
-        log.trace("Record {} previously completed? {}", rec.offset(), previouslyCompleted);
-        return previouslyCompleted;
-    }
+//    // todo move to partition state
+//    public boolean isRecordPreviouslyCompleted(ConsumerRecord<K, V> rec) {
+//        var tp = toTopicPartition(rec);
+//        var partitionState = getPartitionState(tp);
+//        boolean previouslyCompleted = partitionState.isRecordPreviouslyCompleted(rec);
+//        log.trace("Record {} previously completed? {}", rec.offset(), previouslyCompleted);
+//        return previouslyCompleted;
+//    }
 
     /**
      * Check we have capacity in offset storage to process more messages
@@ -339,12 +311,7 @@ void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
         log.debug("Incoming {} new records...", recordsMap.count());
         for (var partition : recordsMap.partitions()) {
             RecordsAndEpoch recordsList = recordsMap.records(partition);
-            long epochOfInboundRecords = recordsList.getEpochOfPartitionAtPoll();
-            List<ConsumerRecord<K, V>> recordPollBatch = recordsList.getRecords();
-            if (!recordPollBatch.isEmpty()) {
-                // should always not be empty, but...
-                maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordsList);
-            }
+            maybeRegisterNewRecordAsWork(recordsList);
         }
     }
 
@@ -353,52 +320,64 @@ void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
      */
     // todo move into PartitionState
     // todo too deep
-    private void maybeRegisterNewRecordAsWork(@NonNull Long epochOfInboundRecords, @NonNull RecordsAndEpoch recordsList) {
-        List<ConsumerRecord<K, V>> recordPollBatch = recordsList.getRecords();
-
-        if (!recordPollBatch.isEmpty()) {
-            final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
-            //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-            ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
-            long batchStartOffset = sampleRecord.offset();
-
-            // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
-            var currentPartitionEpoch = getEpochOfPartitionForRecord(sampleRecord);
-            if (Objects.equals(epochOfInboundRecords, currentPartitionEpoch)) {
-
-                // todo move to partition state from here, as epoch apparently has to be tracked in PSM
-                if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
-                    log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(sampleRecord), sampleRecord);
-                } else {
-                    //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-                    long batchEndOffset = getLast(recordPollBatch).get().offset(); // NOSONAR
+    // todo inline - shrunk
+    private void maybeRegisterNewRecordAsWork(@NonNull RecordsAndEpoch recordsAndEpoch) {
+        Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
+        List<ConsumerRecord<K, V>> recordPollBatch = recordsAndEpoch.getRecords();
 
-                    TopicPartition partition = new TopicPartition(sampleRecord.topic(), sampleRecord.partition());
-                    getPartitionState(partition).maybeTruncate(batchStartOffset, batchEndOffset);
-
-                    maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
-                }
-            } else {
-                log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
-                        epochOfInboundRecords, currentPartitionEpoch);
-            }
+        if (recordPollBatch.isEmpty()) {
+            log.debug("Received empty poll results? {}", recordsAndEpoch);
+        } else {
+//            // check epoch is ok
+//            // todo teach PartitionState to know it's Epoch, move this into PartitionState
+//            {
+//                final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
+//                //noinspection OptionalGetWithoutIsPresent -- already checked not empty
+//                ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
+//                long batchStartOffset = sampleRecord.offset();
+//
+//                // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
+//                var currentPartitionEpoch = getEpochOfPartitionForRecord(sampleRecord);
+//                boolean epochsDontMatch = !Objects.equals(epochOfInboundRecords, currentPartitionEpoch);
+//                if (epochsDontMatch) {
+//                    log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
+//                            epochOfInboundRecords, currentPartitionEpoch);
+//                    return;
+//                }
+//            }
+
+            PartitionState<K, V> partitionState = getPartitionState(partition);
+            partitionState.maybeRegisterNewRecordsAsWork(recordsAndEpoch);
+
+//            // todo move to partition state from here, as epoch apparently has to be tracked in PSM
+//            if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
+//                log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(sampleRecord), sampleRecord);
+//            } else {
+//                //noinspection OptionalGetWithoutIsPresent -- already checked not empty
+//                long batchEndOffset = getLast(recordPollBatch).get().offset(); // NOSONAR
+//
+//                TopicPartition partition = new TopicPartition(sampleRecord.topic(), sampleRecord.partition());
+//                partitionState.maybeTruncate(batchStartOffset, batchEndOffset);
+//
+//                maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
+//            }
         }
     }
 
-    // todo move to partition state
-    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
-        for (var aRecord : recordPollBatch) {
-            if (isRecordPreviouslyCompleted(aRecord)) {
-                log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
-            } else {
-                //noinspection ObjectAllocationInLoop
-                var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
-
-                sm.addWorkContainer(work);
-                addNewIncompleteWorkContainer(work);
-            }
-        }
-    }
+//    // todo move to partition state
+//    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
+//        for (var aRecord : recordPollBatch) {
+//            if (isRecordPreviouslyCompleted(aRecord)) {
+//                log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
+//            } else {
+//                //noinspection ObjectAllocationInLoop
+//                var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
+//
+//                sm.addWorkContainer(work);
+//                addNewIncompleteWorkContainer(work);
+//            }
+//        }
+//    }
 
     public Map<TopicPartition, OffsetAndMetadata> collectDirtyCommitData() {
         var dirties = new HashMap<TopicPartition, OffsetAndMetadata>();
@@ -415,40 +394,17 @@ private Map<TopicPartition, PartitionState<K, V>> getAssignedPartitions() {
                 .collect(Collectors.toMap(Map.Entry::getKey, Map.Entry::getValue)));
     }
 
-    public boolean couldBeTakenAsWork(WorkContainer<?, ?> workContainer) {
-        if (checkIfWorkIsStale(workContainer)) {
-            log.debug("Work is in queue with stale epoch or no longer assigned. Skipping. Shard it came from will/was removed during partition revocation. WC: {}", workContainer);
-            return false;
-        } else if (isAllowedMoreRecords(workContainer)) {
-            return true;
-        } else if (isBlockingProgress(workContainer)) {
-            // allow record to be taken, even if partition is blocked, as this record completion may reduce payload size requirement
-            return true;
-        } else {
-            log.debug("Not allowed more records for the partition ({}) as set from previous encode run (blocked), that this " +
-                            "record ({}) belongs to, due to offset encoding back pressure, is within the encoded payload already (offset lower than highest succeeded, " +
-                            "not in flight ({}), continuing on to next container in shardEntry.",
-                    workContainer.getTopicPartition(), workContainer.offset(), workContainer.isNotInFlight());
-            return false;
-        }
+    public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
+        return getPartitionState(workContainer)
+                .couldBeTakenAsWork(workContainer);
     }
 
-    /**
-     * If the record is below the highest succeeded offset, then it is or will be represented in the current offset
-     * encoding.
-     * <p>
-     * This may in fact be THE message holding up the partition - so must be retried.
-     * <p>
-     * In which case - don't want to skip it.
-     * <p>
-     * Generally speaking, completing more offsets below the highest succeeded (and thus the set represented in the
-     * encoded payload), should usually reduce the payload size requirements.
-     */
-    private boolean isBlockingProgress(WorkContainer<?, ?> workContainer) {
-        var partitionState = getPartitionState(workContainer.getTopicPartition());
-        return workContainer.offset() < partitionState.getOffsetHighestSucceeded();
+    private PartitionState<K, V> getPartitionState(WorkContainer<K, V> workContainer) {
+        TopicPartition topicPartition = workContainer.getTopicPartition();
+        return getPartitionState(topicPartition);
     }
 
+
     public boolean isDirty() {
         return this.partitionStates.values().stream()
                 .anyMatch(PartitionState::isDirty);

From 5eca507b80ae2069b97e7f321294ac63edc31834 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 6 Oct 2022 13:22:25 +0100
Subject: [PATCH 087/131] step: compiles

---
 .../internal/EpochAndRecordsMap.java          |  3 +-
 .../state/PartitionState.java                 | 86 +++++++----------
 .../state/PartitionStateManager.java          | 96 ++++++++++---------
 .../state/RemovedPartitionState.java          | 18 +++-
 .../parallelconsumer/state/WorkManager.java   |  4 +-
 .../offsets/OffsetEncodingTests.java          |  4 +-
 .../state/PartitionStateTest.java             |  4 +-
 7 files changed, 106 insertions(+), 109 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java
index 1edfa3ab9..1ad4f6aa0 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/EpochAndRecordsMap.java
@@ -27,7 +27,7 @@ public EpochAndRecordsMap(ConsumerRecords<K, V> poll, PartitionStateManager<K, V
         poll.partitions().forEach(partition -> {
             var records = poll.records(partition);
             Long epochOfPartition = pm.getEpochOfPartition(partition);
-            RecordsAndEpoch entry = new RecordsAndEpoch(epochOfPartition, records);
+            RecordsAndEpoch entry = new RecordsAndEpoch(partition, epochOfPartition, records);
             recordMap.put(partition, entry);
         });
     }
@@ -63,6 +63,7 @@ public int count() {
 
     @Value
     public class RecordsAndEpoch {
+        @NonNull TopicPartition topicPartition;
         @NonNull Long epochOfPartitionAtPoll;
         @NonNull List<ConsumerRecord<K, V>> records;
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 3c1c3d927..65bd1e926 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -6,6 +6,7 @@
 
 import io.confluent.parallelconsumer.internal.BrokerPollSystem;
 import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
+import io.confluent.parallelconsumer.internal.PCModule;
 import io.confluent.parallelconsumer.offsets.NoEncodingPossibleException;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
 import lombok.Getter;
@@ -22,9 +23,6 @@
 import java.util.concurrent.ConcurrentSkipListSet;
 import java.util.stream.Collectors;
 
-import static io.confluent.csid.utils.JavaUtils.getFirst;
-import static io.confluent.csid.utils.JavaUtils.getLast;
-import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
 import static io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.DefaultMaxMetadataSize;
 import static java.util.Optional.empty;
 import static java.util.Optional.of;
@@ -46,10 +44,12 @@ public class PartitionState<K, V> {
      */
     public static final long KAFKA_OFFSET_ABSENCE = -1L;
 
+    private PCModule<K, V> module;
+
     /**
      * Used for adding work to, if it's been successfully added to our tracked state
      *
-     * @see #maybeRegisterNewRecordAsWork
+     * @see #maybeRegisterNewPollBatchAsWork
      */
     @NonNull
     private final ShardManager<K, V> sm;
@@ -193,6 +193,8 @@ private void setDirty() {
         setDirty(true);
     }
 
+    // todo rename isRecordComplete()
+    // todo add support for this to TruthGen
     public boolean isRecordPreviouslyCompleted(final ConsumerRecord<K, V> rec) {
         long recOffset = rec.offset();
         if (!incompleteOffsets.contains(recOffset)) {
@@ -242,51 +244,25 @@ private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
         }
     }
 
+    private boolean epochIsStale(EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
+        // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
+        var currentPartitionEpoch = getPartitionsAssignmentEpoch();
+        Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
 
-    public void maybeRegisterNewRecordsAsWork(@NonNull EpochAndRecordsMap.RecordsAndEpoch recordsAndEpoch) {
-        // todo move to partition state from here, as epoch apparently has to be tracked in PSM
-        var recordPollBatch = recordsAndEpoch.getRecords();
-        final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
-        //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-        ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
-
-        // check epoch is ok
-        // move to method
-        // todo teach PartitionState to know it's Epoch, move this into PartitionState
-        {
-            final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
-            //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-            ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
-            long batchStartOffset = sampleRecord.offset();
-
-            // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
-            var currentPartitionEpoch = getPartitionsAssignmentEpoch();
-            Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
-
-            boolean epochsDontMatch = !Objects.equals(epochOfInboundRecords, currentPartitionEpoch);
-            if (epochsDontMatch) {
-                log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
-                        epochOfInboundRecords, currentPartitionEpoch);
-                return;
-            }
-        }
-
-
-        if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
-            log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(sampleRecord), sampleRecord);
-        } else {
-            //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-            long batchEndOffset = getLast(recordPollBatch).get().offset(); // NOSONAR
-
-            TopicPartition partition = new TopicPartition(sampleRecord.topic(), sampleRecord.partition());
-            partitionState.maybeTruncate(batchStartOffset, batchEndOffset);
-
-            maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
-        }
+        return !Objects.equals(epochOfInboundRecords, currentPartitionEpoch);
     }
 
     //    // todo move to partition state
-    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
+    public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
+        if (epochIsStale(recordsAndEpoch)) {
+            log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
+                    recordsAndEpoch.getEpochOfPartitionAtPoll(), getPartitionsAssignmentEpoch());
+            return;
+        }
+
+        //
+        Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
+        List<ConsumerRecord<K, V>> recordPollBatch = recordsAndEpoch.getRecords();
         for (var aRecord : recordPollBatch) {
             if (isRecordPreviouslyCompleted(aRecord)) {
                 log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
@@ -298,16 +274,19 @@ private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<Consu
                 addNewIncompleteWorkContainer(work);
             }
         }
+
     }
 
     // todo move to partition state
-    public boolean isPartitionRemovedOrNeverAssigned(ConsumerRecord<?, ?> rec) {
-        TopicPartition topicPartition = toTopicPartition(rec);
-        var partitionState = getPartitionState(topicPartition);
-        boolean hasNeverBeenAssigned = partitionState == null;
-        return hasNeverBeenAssigned || partitionState.isRemoved();
+    public boolean isPartitionRemovedOrNeverAssigned() {
+//        TopicPartition topicPartition = toTopicPartition(rec);
+//        var partitionState = getPartitionState(topicPartition);
+//        boolean hasNeverBeenAssigned = partitionState == null;
+//        return hasNeverBeenAssigned || partitionState.isRemoved();
+        return false;
     }
 
+    // todo make private and update tests
     public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
 
@@ -531,7 +510,7 @@ public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
         if (checkIfWorkIsStale(workContainer)) {
             log.debug("Work is in queue with stale epoch or no longer assigned. Skipping. Shard it came from will/was removed during partition revocation. WC: {}", workContainer);
             return false;
-        } else if (isAllowedMoreRecords(workContainer)) {
+        } else if (isAllowedMoreRecords()) {
             return true;
         } else if (isBlockingProgress(workContainer)) {
             // allow record to be taken, even if partition is blocked, as this record completion may reduce payload size requirement
@@ -555,12 +534,10 @@ public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
      * @return true if epoch doesn't match, false if ok
      */
     boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
-        var topicPartitionKey = workContainer.getTopicPartition();
-
         Long currentPartitionEpoch = getPartitionsAssignmentEpoch();
         long workEpoch = workContainer.getEpoch();
 
-        boolean partitionNotAssigned = isPartitionRemovedOrNeverAssigned(workContainer.getCr());
+        boolean partitionNotAssigned = isPartitionRemovedOrNeverAssigned();
 
         boolean epochMissMatch = currentPartitionEpoch != workEpoch;
 
@@ -573,6 +550,7 @@ boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
     }
 
     private Long getPartitionsAssignmentEpoch() {
+        // todo teach PartitionState to know it's Epoch, move this into PartitionState
         throw new RuntimeException();
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 0d2421146..cb8754c20 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -5,11 +5,12 @@
  */
 
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
-import io.confluent.parallelconsumer.internal.*;
-import io.confluent.parallelconsumer.internal.EpochAndRecordsMap.RecordsAndEpoch;
+import io.confluent.parallelconsumer.internal.AbstractParallelEoSStreamProcessor;
+import io.confluent.parallelconsumer.internal.BrokerPollSystem;
+import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
+import io.confluent.parallelconsumer.internal.PCModule;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
 import lombok.Getter;
-import lombok.NonNull;
 import lombok.Setter;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.Consumer;
@@ -18,7 +19,10 @@
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 
-import java.util.*;
+import java.util.Collection;
+import java.util.Collections;
+import java.util.HashMap;
+import java.util.Map;
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.stream.Collectors;
 
@@ -78,6 +82,10 @@ public PartitionState<K, V> getPartitionState(TopicPartition tp) {
         return partitionStates.get(tp);
     }
 
+    private PartitionState<K, V> getPartitionState(EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
+        return getPartitionState(recordsAndEpoch.getTopicPartition());
+    }
+
     /**
      * Load offset map for assigned assignedPartitions
      */
@@ -191,17 +199,17 @@ private void resetOffsetMapAndRemoveWork(Collection<TopicPartition> allRemovedPa
         }
     }
 
-    /**
-     * @return the current epoch of the partition this record belongs to
-     */
-    public Long getEpochOfPartitionForRecord(final ConsumerRecord<K, V> rec) {
-        var tp = toTopicPartition(rec);
-        Long epoch = partitionsAssignmentEpochs.get(tp);
-        if (epoch == null) {
-            throw new InternalRuntimeError(msg("Received message for a partition which is not assigned: {}", rec));
-        }
-        return epoch;
-    }
+//    /**
+//     * @return the current epoch of the partition this record belongs to
+//     */
+//    public Long getEpochOfPartitionForRecord(final ConsumerRecord<K, V> rec) {
+//        var tp = toTopicPartition(rec);
+//        Long epoch = partitionsAssignmentEpochs.get(tp);
+//        if (epoch == null) {
+//            throw new InternalRuntimeError(msg("Received message for a partition which is not assigned: {}", rec));
+//        }
+//        return epoch;
+//    }
 
     /**
      * @return the current epoch of the partition
@@ -262,12 +270,6 @@ public long getHighestSeenOffset(final TopicPartition tp) {
         return getPartitionState(tp).getOffsetHighestSeen();
     }
 
-    // todo move to partition state
-    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
-        var tp = wc.getTopicPartition();
-        getPartitionState(tp).addNewIncompleteWorkContainer(wc);
-    }
-
     /**
      * Checks if partition is blocked with back pressure.
      * <p>
@@ -281,9 +283,9 @@ public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
      *
      * @see OffsetMapCodecManager#DefaultMaxMetadataSize
      */
-    public boolean isBlocked(final TopicPartition topicPartition) {
-        return !isAllowedMoreRecords(topicPartition);
-    }
+//    public boolean isBlocked(final TopicPartition topicPartition) {
+//        return !isAllowedMoreRecords(topicPartition);
+//    }
 
     // todo move to partition state
     public boolean isPartitionRemovedOrNeverAssigned(ConsumerRecord<?, ?> rec) {
@@ -309,25 +311,29 @@ public void onFailure(WorkContainer<K, V> wc) {
      */
     void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
         log.debug("Incoming {} new records...", recordsMap.count());
-        for (var partition : recordsMap.partitions()) {
-            RecordsAndEpoch recordsList = recordsMap.records(partition);
-            maybeRegisterNewRecordAsWork(recordsList);
+        for (var recordsAndEpoch : recordsMap.getRecordMap().values()) {
+//        for (var partition : recordsMap.partitions()) {
+//            var recordsAndEpoch = recordsMap.records(partition);
+
+            PartitionState<K, V> partitionState = getPartitionState(recordsAndEpoch);
+            partitionState.maybeRegisterNewPollBatchAsWork(recordsAndEpoch);
         }
     }
 
-    /**
-     * @see #maybeRegisterNewRecordAsWork(EpochAndRecordsMap)
-     */
-    // todo move into PartitionState
-    // todo too deep
-    // todo inline - shrunk
-    private void maybeRegisterNewRecordAsWork(@NonNull RecordsAndEpoch recordsAndEpoch) {
-        Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
-        List<ConsumerRecord<K, V>> recordPollBatch = recordsAndEpoch.getRecords();
-
-        if (recordPollBatch.isEmpty()) {
-            log.debug("Received empty poll results? {}", recordsAndEpoch);
-        } else {
+
+//    /**
+//     * @see #maybeRegisterNewRecordAsWork(EpochAndRecordsMap)
+//     */
+//    // todo move into PartitionState
+//    // todo too deep
+//    // todo inline - shrunk
+//    private void maybeRegisterNewRecordAsWork(@NonNull RecordsAndEpoch recordsAndEpoch) {
+//        Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
+//        List<ConsumerRecord<K, V>> recordPollBatch = recordsAndEpoch.getRecords();
+
+//        if (recordPollBatch.isEmpty()) {
+//            log.debug("Received empty poll results? {}", recordsAndEpoch);
+//        } else {
 //            // check epoch is ok
 //            // todo teach PartitionState to know it's Epoch, move this into PartitionState
 //            {
@@ -346,8 +352,8 @@ private void maybeRegisterNewRecordAsWork(@NonNull RecordsAndEpoch recordsAndEpo
 //                }
 //            }
 
-            PartitionState<K, V> partitionState = getPartitionState(partition);
-            partitionState.maybeRegisterNewRecordsAsWork(recordsAndEpoch);
+//            PartitionState<K, V> partitionState = getPartitionState(recordsAndEpoch.getTopicPartition());
+//            partitionState.maybeRegisterNewPollBatchAsWork(recordsAndEpoch);
 
 //            // todo move to partition state from here, as epoch apparently has to be tracked in PSM
 //            if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
@@ -361,8 +367,8 @@ private void maybeRegisterNewRecordAsWork(@NonNull RecordsAndEpoch recordsAndEpo
 //
 //                maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
 //            }
-        }
-    }
+//        }
+//    }
 
 //    // todo move to partition state
 //    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
@@ -399,7 +405,7 @@ public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
                 .couldBeTakenAsWork(workContainer);
     }
 
-    private PartitionState<K, V> getPartitionState(WorkContainer<K, V> workContainer) {
+    protected PartitionState<K, V> getPartitionState(WorkContainer<K, V> workContainer) {
         TopicPartition topicPartition = workContainer.getTopicPartition();
         return getPartitionState(topicPartition);
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index e3bc66065..d61bd9683 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -5,7 +5,9 @@
  */
 
 import io.confluent.csid.utils.KafkaUtils;
+import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
+import lombok.NonNull;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.common.TopicPartition;
@@ -54,10 +56,15 @@ public TopicPartition getTp() {
         return null;
     }
 
-    @Override
-    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
+//    @Override
+//    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
+//        // no-op
+//        log.warn("Dropping new work container for partition no longer assigned. WC: {}", wc);
+//    }
+
+    public void maybeRegisterNewRecordsAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
         // no-op
-        log.warn("Dropping new work container for partition no longer assigned. WC: {}", wc);
+        log.warn("Dropping polled record batch for partition no longer assigned. WC: {}", recordsAndEpoch);
     }
 
     /**
@@ -112,5 +119,8 @@ public void onSuccess(final WorkContainer<K, V> work) {
         log.debug("Dropping completed work container for partition no longer assigned. WC: {}, partition: {}", work, work.getTopicPartition());
     }
 
-
+//    @Override
+//    public boolean isPartitionRemovedOrNeverAssigned() {
+//        return true;
+//    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
index b14c36194..cb5150e4e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
@@ -207,8 +207,8 @@ public boolean checkIfWorkIsStale(final List<WorkContainer<K, V>> workContainers
      *
      * @return true if epoch doesn't match, false if ok
      */
-    public boolean checkIfWorkIsStale(final WorkContainer<K, V> workContainer) {
-        return pm.checkIfWorkIsStale(workContainer);
+    public boolean checkIfWorkIsStale(WorkContainer<K, V> workContainer) {
+        return pm.getPartitionState(workContainer).checkIfWorkIsStale(workContainer);
     }
 
     public boolean shouldThrottle() {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
index 56aa02e8e..ad60621ee 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
@@ -247,7 +247,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
             // check record is marked as incomplete
             var anIncompleteRecord = records.get(3);
-            Truth.assertThat(pm.isRecordPreviouslyCompleted(anIncompleteRecord)).isFalse();
+            assertThat(partitionState.isRecordPreviouslyCompleted(anIncompleteRecord)).isFalse();
 
             // check state
             {
@@ -264,7 +264,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
                     var incompletes = partitionState.getIncompleteOffsetsBelowHighestSucceeded();
                     Truth.assertThat(incompletes).containsExactlyElementsIn(expected);
 
-                    Truth.assertThat(pm.isRecordPreviouslyCompleted(anIncompleteRecord)).isFalse();
+                    assertThat(partitionState.isRecordPreviouslyCompleted(anIncompleteRecord)).isFalse();
                 }
             }
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
index 499e81718..d2285bdce 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -8,6 +8,7 @@
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
 import org.apache.kafka.common.TopicPartition;
+import org.junit.jupiter.api.Disabled;
 import org.junit.jupiter.api.Test;
 import pl.tlinkowski.unij.api.UniLists;
 
@@ -27,6 +28,7 @@ class PartitionStateTest {
      */
     // parameter test with offsets closer together to check off by one
     @Test
+    @Disabled("TODO - broken - see other branch")
     void bootstrapTruncation() {
         long unexpectedlyHighOffset = 20L;
         final long previouslyCommittedOffset = 11L;
@@ -43,7 +45,7 @@ void bootstrapTruncation() {
         var w20 = mu.createWorkFor(unexpectedlyHighOffset);
 
         // bootstrap the first record, triggering truncation - it's offset #unexpectedlyHighOffset, but we were expecting #previouslyCommittedOffset
-        state.addNewIncompleteWorkContainer(w20);
+//        state.addNewIncompleteWorkContainer(w20);
 
 
         Truth.assertThat(state.getNextExpectedInitialPolledOffset()).isEqualTo(unexpectedlyHighOffset);

From d97f87913e264a6f8910d9c44508d44c692d8513 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 6 Oct 2022 14:34:38 +0100
Subject: [PATCH 088/131] delete refactored code

---
 .../state/PartitionState.java                 |  70 ++--------
 .../state/PartitionStateManager.java          | 129 +-----------------
 2 files changed, 19 insertions(+), 180 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 65bd1e926..4cb4b46a1 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -137,7 +137,7 @@ public class PartitionState<K, V> {
      * <p>
      * Default (missing elements) is true - more messages can be processed.
      * <p>
-     * AKA high water mark (which is a deprecated description).
+     * AKA high watermark (which is a deprecated description).
      *
      * @see OffsetMapCodecManager#DefaultMaxMetadataSize
      */
@@ -169,8 +169,8 @@ public PartitionState(TopicPartition tp, OffsetMapCodecManager.HighestOffsetAndI
         this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
         this.incompleteOffsets = new ConcurrentSkipListSet<>(offsetData.getIncompleteOffsets());
         this.offsetHighestSucceeded = this.offsetHighestSeen;
-        this.nextExpectedPolledOffset = getNextExpectedInitialPolledOffset();
         this.sm = null;
+        this.module = pcModule;
     }
 
     private void maybeRaiseHighestSeenOffset(final long offset) {
@@ -197,12 +197,12 @@ private void setDirty() {
     // todo add support for this to TruthGen
     public boolean isRecordPreviouslyCompleted(final ConsumerRecord<K, V> rec) {
         long recOffset = rec.offset();
-        if (!incompleteOffsets.contains(recOffset)) {
-            // if within the range of tracked offsets, must have been previously completed, as it's not in the incomplete set
-            return recOffset <= offsetHighestSeen;
-        } else {
+        if (incompleteOffsets.contains(recOffset)) {
             // we haven't recorded this far up, so must not have been processed yet
             return false;
+        } else {
+            // if within the range of tracked offsets, must have been previously completed, as it's not in the incomplete set
+            return recOffset <= offsetHighestSeen;
         }
     }
 
@@ -252,7 +252,6 @@ private boolean epochIsStale(EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAnd
         return !Objects.equals(epochOfInboundRecords, currentPartitionEpoch);
     }
 
-    //    // todo move to partition state
     public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
         if (epochIsStale(recordsAndEpoch)) {
             log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
@@ -261,7 +260,7 @@ public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.Re
         }
 
         //
-        Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
+        long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
         List<ConsumerRecord<K, V>> recordPollBatch = recordsAndEpoch.getRecords();
         for (var aRecord : recordPollBatch) {
             if (isRecordPreviouslyCompleted(aRecord)) {
@@ -277,25 +276,13 @@ public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.Re
 
     }
 
-    // todo move to partition state
     public boolean isPartitionRemovedOrNeverAssigned() {
-//        TopicPartition topicPartition = toTopicPartition(rec);
-//        var partitionState = getPartitionState(topicPartition);
-//        boolean hasNeverBeenAssigned = partitionState == null;
-//        return hasNeverBeenAssigned || partitionState.isRemoved();
         return false;
     }
 
-    // todo make private and update tests
     public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
 
-//        if (noWorkAddedYet) {
-//            noWorkAddedYet = false;
-//            long bootstrapOffset = wc.offset();
-//        maybeTruncateBelow(newOffset);
-//        }
-
         maybeRaiseHighestSeenOffset(newOffset);
         commitQueue.put(newOffset, wc);
 
@@ -303,42 +290,6 @@ public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         incompleteOffsets.add(newOffset);
     }
 
-    /**
-     * If the offset is higher than expected, according to the previously committed / polled offset, truncate up to it.
-     * Offsets between have disappeared and will never be polled again.
-     */
-    private void maybeTruncateBelow(long polledOffset) {
-        long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
-        boolean bootstrapRecordAboveExpected = polledOffset > nextExpectedPolledOffset;
-        if (bootstrapRecordAboveExpected) {
-            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'", polledOffset, nextExpectedPolledOffset);
-            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(polledOffset);
-            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
-            this.incompleteOffsets = wrapped;
-        }
-
-        this.nextExpectedPolledOffset = polledOffset + 1;
-    }
-
-    public void maybeTruncate(long batchStartOffset, long batchEndOffset) {
-        long nextExpectedPolledOffset = this.getNextExpectedPolledOffset();
-        boolean bootstrapRecordAboveExpected = batchStartOffset > nextExpectedPolledOffset;
-        if (bootstrapRecordAboveExpected) {
-            log.debug("Truncating state - offsets have been removed form the partition by the broker. Polled {} but expected {} - e.g. record retention expiring, with 'auto.offset.reset'", batchStartOffset, nextExpectedPolledOffset);
-            NavigableSet<Long> truncatedIncompletes = incompleteOffsets.tailSet(batchStartOffset);
-            ConcurrentSkipListSet<Long> wrapped = new ConcurrentSkipListSet<>(truncatedIncompletes);
-            this.incompleteOffsets = wrapped;
-        }
-
-        this.nextExpectedPolledOffset = batchEndOffset + 1;
-    }
-
-    private long nextExpectedPolledOffset = KAFKA_OFFSET_ABSENCE;
-
-    private long getNextExpectedPolledOffset() {
-        return nextExpectedPolledOffset;
-    }
-
     /**
      * Has this partition been removed? No.
      *
@@ -506,6 +457,9 @@ private boolean isBlockingProgress(WorkContainer<?, ?> workContainer) {
         return workContainer.offset() < getOffsetHighestSucceeded();
     }
 
+    /**
+     * TODO docs
+     */
     public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
         if (checkIfWorkIsStale(workContainer)) {
             log.debug("Work is in queue with stale epoch or no longer assigned. Skipping. Shard it came from will/was removed during partition revocation. WC: {}", workContainer);
@@ -524,7 +478,6 @@ public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
         }
     }
 
-
     /**
      * Have our partitions been revoked?
      * <p>
@@ -549,6 +502,9 @@ boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
         return false;
     }
 
+    /**
+     * todo docs
+     */
     private Long getPartitionsAssignmentEpoch() {
         // todo teach PartitionState to know it's Epoch, move this into PartitionState
         throw new RuntimeException();
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index cb8754c20..8996ee0d8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -15,7 +15,6 @@
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerRebalanceListener;
-import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 
@@ -26,8 +25,6 @@
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.stream.Collectors;
 
-import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
-
 /**
  * In charge of managing {@link PartitionState}s.
  * <p>
@@ -86,6 +83,11 @@ private PartitionState<K, V> getPartitionState(EpochAndRecordsMap<K, V>.RecordsA
         return getPartitionState(recordsAndEpoch.getTopicPartition());
     }
 
+    protected PartitionState<K, V> getPartitionState(WorkContainer<K, V> workContainer) {
+        TopicPartition topicPartition = workContainer.getTopicPartition();
+        return getPartitionState(topicPartition);
+    }
+
     /**
      * Load offset map for assigned assignedPartitions
      */
@@ -199,18 +201,6 @@ private void resetOffsetMapAndRemoveWork(Collection<TopicPartition> allRemovedPa
         }
     }
 
-//    /**
-//     * @return the current epoch of the partition this record belongs to
-//     */
-//    public Long getEpochOfPartitionForRecord(final ConsumerRecord<K, V> rec) {
-//        var tp = toTopicPartition(rec);
-//        Long epoch = partitionsAssignmentEpochs.get(tp);
-//        if (epoch == null) {
-//            throw new InternalRuntimeError(msg("Received message for a partition which is not assigned: {}", rec));
-//        }
-//        return epoch;
-//    }
-
     /**
      * @return the current epoch of the partition
      */
@@ -226,15 +216,6 @@ private void incrementPartitionAssignmentEpoch(final Collection<TopicPartition>
         }
     }
 
-//    // todo move to partition state
-//    public boolean isRecordPreviouslyCompleted(ConsumerRecord<K, V> rec) {
-//        var tp = toTopicPartition(rec);
-//        var partitionState = getPartitionState(tp);
-//        boolean previouslyCompleted = partitionState.isRecordPreviouslyCompleted(rec);
-//        log.trace("Record {} previously completed? {}", rec.offset(), previouslyCompleted);
-//        return previouslyCompleted;
-//    }
-
     /**
      * Check we have capacity in offset storage to process more messages
      */
@@ -270,31 +251,6 @@ public long getHighestSeenOffset(final TopicPartition tp) {
         return getPartitionState(tp).getOffsetHighestSeen();
     }
 
-    /**
-     * Checks if partition is blocked with back pressure.
-     * <p>
-     * If false, more messages are allowed to process for this partition.
-     * <p>
-     * If true, we have calculated that we can't record any more offsets for this partition, as our best performing
-     * encoder requires nearly as much space is available for this partitions allocation of the maximum offset metadata
-     * size.
-     * <p>
-     * Default (missing elements) is true - more messages can be processed.
-     *
-     * @see OffsetMapCodecManager#DefaultMaxMetadataSize
-     */
-//    public boolean isBlocked(final TopicPartition topicPartition) {
-//        return !isAllowedMoreRecords(topicPartition);
-//    }
-
-    // todo move to partition state
-    public boolean isPartitionRemovedOrNeverAssigned(ConsumerRecord<?, ?> rec) {
-        TopicPartition topicPartition = toTopicPartition(rec);
-        var partitionState = getPartitionState(topicPartition);
-        boolean hasNeverBeenAssigned = partitionState == null;
-        return hasNeverBeenAssigned || partitionState.isRemoved();
-    }
-
     public void onSuccess(WorkContainer<K, V> wc) {
         PartitionState<K, V> partitionState = getPartitionState(wc.getTopicPartition());
         partitionState.onSuccess(wc);
@@ -312,83 +268,16 @@ public void onFailure(WorkContainer<K, V> wc) {
     void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
         log.debug("Incoming {} new records...", recordsMap.count());
         for (var recordsAndEpoch : recordsMap.getRecordMap().values()) {
-//        for (var partition : recordsMap.partitions()) {
-//            var recordsAndEpoch = recordsMap.records(partition);
-
             PartitionState<K, V> partitionState = getPartitionState(recordsAndEpoch);
             partitionState.maybeRegisterNewPollBatchAsWork(recordsAndEpoch);
         }
     }
 
-
-//    /**
-//     * @see #maybeRegisterNewRecordAsWork(EpochAndRecordsMap)
-//     */
-//    // todo move into PartitionState
-//    // todo too deep
-//    // todo inline - shrunk
-//    private void maybeRegisterNewRecordAsWork(@NonNull RecordsAndEpoch recordsAndEpoch) {
-//        Long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
-//        List<ConsumerRecord<K, V>> recordPollBatch = recordsAndEpoch.getRecords();
-
-//        if (recordPollBatch.isEmpty()) {
-//            log.debug("Received empty poll results? {}", recordsAndEpoch);
-//        } else {
-//            // check epoch is ok
-//            // todo teach PartitionState to know it's Epoch, move this into PartitionState
-//            {
-//                final Optional<ConsumerRecord<K, V>> recOpt = getFirst(recordPollBatch);
-//                //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-//                ConsumerRecord<K, V> sampleRecord = recOpt.get(); // NOSONAR
-//                long batchStartOffset = sampleRecord.offset();
-//
-//                // do epochs still match? do a proactive check, but the epoch will be checked again at work completion as well
-//                var currentPartitionEpoch = getEpochOfPartitionForRecord(sampleRecord);
-//                boolean epochsDontMatch = !Objects.equals(epochOfInboundRecords, currentPartitionEpoch);
-//                if (epochsDontMatch) {
-//                    log.debug("Inbound record of work has epoch ({}) not matching currently assigned epoch for the applicable partition ({}), skipping",
-//                            epochOfInboundRecords, currentPartitionEpoch);
-//                    return;
-//                }
-//            }
-
-//            PartitionState<K, V> partitionState = getPartitionState(recordsAndEpoch.getTopicPartition());
-//            partitionState.maybeRegisterNewPollBatchAsWork(recordsAndEpoch);
-
-//            // todo move to partition state from here, as epoch apparently has to be tracked in PSM
-//            if (isPartitionRemovedOrNeverAssigned(sampleRecord)) {
-//                log.debug("Record in buffer for a partition no longer assigned. Dropping. TP: {} rec: {}", toTopicPartition(sampleRecord), sampleRecord);
-//            } else {
-//                //noinspection OptionalGetWithoutIsPresent -- already checked not empty
-//                long batchEndOffset = getLast(recordPollBatch).get().offset(); // NOSONAR
-//
-//                TopicPartition partition = new TopicPartition(sampleRecord.topic(), sampleRecord.partition());
-//                partitionState.maybeTruncate(batchStartOffset, batchEndOffset);
-//
-//                maybeRegisterNewRecordAsWork(epochOfInboundRecords, recordPollBatch);
-//            }
-//        }
-//    }
-
-//    // todo move to partition state
-//    private void maybeRegisterNewRecordAsWork(Long epochOfInboundRecords, List<ConsumerRecord<K, V>> recordPollBatch) {
-//        for (var aRecord : recordPollBatch) {
-//            if (isRecordPreviouslyCompleted(aRecord)) {
-//                log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
-//            } else {
-//                //noinspection ObjectAllocationInLoop
-//                var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
-//
-//                sm.addWorkContainer(work);
-//                addNewIncompleteWorkContainer(work);
-//            }
-//        }
-//    }
-
     public Map<TopicPartition, OffsetAndMetadata> collectDirtyCommitData() {
         var dirties = new HashMap<TopicPartition, OffsetAndMetadata>();
         for (var state : getAssignedPartitions().values()) {
             var offsetAndMetadata = state.getCommitDataIfDirty();
+            //noinspection ObjectAllocationInLoop
             offsetAndMetadata.ifPresent(andMetadata -> dirties.put(state.getTp(), andMetadata));
         }
         return dirties;
@@ -405,12 +294,6 @@ public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
                 .couldBeTakenAsWork(workContainer);
     }
 
-    protected PartitionState<K, V> getPartitionState(WorkContainer<K, V> workContainer) {
-        TopicPartition topicPartition = workContainer.getTopicPartition();
-        return getPartitionState(topicPartition);
-    }
-
-
     public boolean isDirty() {
         return this.partitionStates.values().stream()
                 .anyMatch(PartitionState::isDirty);

From 39cc5ec5ba6c353db2fbd9e494b9303318c3d7fe Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 6 Oct 2022 15:36:40 +0100
Subject: [PATCH 089/131] START: Unify PartitionState collections

---
 .../AbstractParallelEoSStreamProcessor.java   |  37 +-----
 .../state/PartitionState.java                 | 117 ++++++++++--------
 .../state/PartitionStateManager.java          |  10 +-
 .../state/RemovedPartitionState.java          |   4 +-
 .../parallelconsumer/state/ShardManager.java  |  36 ++++--
 .../parallelconsumer/state/WorkManager.java   |  16 +--
 .../WorkManagerOffsetMapCodecManagerTest.java |   2 +-
 .../state/WorkManagerTest.java                |   2 +-
 8 files changed, 108 insertions(+), 116 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
index 9de21fe44..2a7cdb296 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
@@ -19,7 +19,6 @@
 import org.apache.kafka.clients.consumer.MockConsumer;
 import org.apache.kafka.clients.consumer.internals.ConsumerCoordinator;
 import org.apache.kafka.common.TopicPartition;
-import org.apache.kafka.common.utils.Time;
 import org.slf4j.MDC;
 
 import javax.naming.InitialContext;
@@ -554,30 +553,6 @@ private boolean isResponsibleForCommits() {
         return (committer instanceof ProducerManager);
     }
 
-    /**
-     * Block the calling thread until no more messages are being processed.
-     * <p>
-     * Used for testing.
-     *
-     * @deprecated no longer used, will be removed in next version
-     */
-    // TODO delete
-    @Deprecated
-    @SneakyThrows
-    public void waitForProcessedNotCommitted(Duration timeout) {
-        log.debug("Waiting processed but not committed...");
-        var timer = Time.SYSTEM.timer(timeout);
-        while (wm.isRecordsAwaitingToBeCommitted()) {
-            log.trace("Waiting for no in processing...");
-            Thread.sleep(100);
-            timer.update();
-            if (timer.isExpired()) {
-                throw new TimeoutException("Waiting for no more records in processing");
-            }
-        }
-        log.debug("No longer anything in flight.");
-    }
-
     private boolean isRecordsAwaitingProcessing() {
         boolean isRecordsAwaitingProcessing = wm.isRecordsAwaitingProcessing();
         boolean threadsDone = areMyThreadsDone();
@@ -730,7 +705,7 @@ protected <R> void controlLoop(Function<PollContextInternal<K, V>, List<R>> user
 
         // end of loop
         log.trace("End of control loop, waiting processing {}, remaining in partition queues: {}, out for processing: {}. In state: {}",
-                wm.getNumberOfWorkQueuedInShardsAwaitingSelection(), wm.getNumberOfEntriesInPartitionQueues(), wm.getNumberRecordsOutForProcessing(), state);
+                wm.getNumberOfWorkQueuedInShardsAwaitingSelection(), wm.getNumberOfIncompleteOffsets(), wm.getNumberRecordsOutForProcessing(), state);
     }
 
     /**
@@ -1099,10 +1074,10 @@ private boolean lingeringOnCommitWouldBeBeneficial() {
         boolean workInFlight = wm.hasWorkInFlight();
         // work mailbox is empty
         boolean workWaitingInMailbox = !workMailBox.isEmpty();
-        boolean workWaitingToCommit = wm.hasWorkInCommitQueues();
-        log.trace("workIsWaitingToBeCompletedSuccessfully {} || workInFlight {} || workWaitingInMailbox {} || !workWaitingToCommit {};",
-                workIsWaitingToBeCompletedSuccessfully, workInFlight, workWaitingInMailbox, !workWaitingToCommit);
-        boolean result = workIsWaitingToBeCompletedSuccessfully || workInFlight || workWaitingInMailbox || !workWaitingToCommit;
+        boolean workWaitingToProcess = wm.hasIncompleteOffsets();
+        log.trace("workIsWaitingToBeCompletedSuccessfully {} || workInFlight {} || workWaitingInMailbox {} || !workWaitingToProcess {};",
+                workIsWaitingToBeCompletedSuccessfully, workInFlight, workWaitingInMailbox, !workWaitingToProcess);
+        boolean result = workIsWaitingToBeCompletedSuccessfully || workInFlight || workWaitingInMailbox || !workWaitingToProcess;
 
         // todo disable - commit frequency takes care of lingering? is this outdated?
         return false;
@@ -1244,7 +1219,7 @@ public void notifySomethingToDo() {
 
     @Override
     public long workRemaining() {
-        return wm.getNumberOfEntriesInPartitionQueues();
+        return wm.getNumberOfIncompleteOffsets();
     }
 
     /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 4cb4b46a1..dfd6bd3c1 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -20,7 +20,6 @@
 
 import java.util.*;
 import java.util.concurrent.ConcurrentSkipListMap;
-import java.util.concurrent.ConcurrentSkipListSet;
 import java.util.stream.Collectors;
 
 import static io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.DefaultMaxMetadataSize;
@@ -95,7 +94,21 @@ public class PartitionState<K, V> {
      * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
      *         storage
      */
-    private ConcurrentSkipListSet<Long> incompleteOffsets;
+//    private ConcurrentSkipListSet<Long> incompleteOffsets;
+    private final ConcurrentSkipListMap<Long, Optional<ConsumerRecord<K, V>>> incompleteOffsets;
+//    private final ConcurrentSkipListSet<OffsetContainerPair> incompleteOffsets;
+
+//    @Data
+//    @AllArgsConstructor
+//    protected class OffsetContainerPair implements Comparable<Long> {
+//        Long offset;
+//        Optional<ConsumerRecord<K, V>> workContainer;
+//
+//        @Override
+//        public int compareTo(@NonNull final Long o) {
+//            return offset.compareTo(o);
+//        }
+//    }
 
     /**
      * Marker for the first record to be tracked. Used for some initial analysis.
@@ -145,29 +158,35 @@ public class PartitionState<K, V> {
     @Setter(PRIVATE)
     private boolean allowedMoreRecords = true;
 
-    /**
-     * Map of offsets to {@link WorkContainer}s.
-     * <p>
-     * Need to record globally consumed records, to ensure correct offset order committal. Cannot rely on incrementally
-     * advancing offsets, as this isn't a guarantee of kafka's (see {@link #incompleteOffsets}).
-     * <p>
-     * Concurrent because either the broker poller thread or the control thread may be requesting offset to commit
-     * ({@link #getCommitDataIfDirty()}), or reading upon {@link #onPartitionsRemoved}. This requirement is removed in
-     * the upcoming PR #200 Refactor: Consider a shared nothing * architecture.
-     */
-    // todo rename - it's not a queue of things to be committed - it's a collection of incomplete offsets and their WorkContainers
-    // todo delete? seems this can be replaced by #incompletes - the work container info isn't used
-    @ToString.Exclude
-    private final NavigableMap<Long, WorkContainer<K, V>> commitQueue = new ConcurrentSkipListMap<>();
+//    /**
+//     * Map of offsets to {@link WorkContainer}s.
+//     * <p>
+//     * Concurrent because either the broker poller thread or the control thread may be requesting offset to commit
+//     * ({@link #getCommitDataIfDirty()}), or reading upon {@link #onPartitionsRemoved}. This requirement is removed in
+//     * the upcoming PR #200 Refactor: Consider a shared nothing * architecture.
+//     */
+//    // todo rename - it's not a queue of things to be committed - it's a collection of incomplete offsets and their WorkContainers
+//    // todo delete? seems this can be replaced by #incompletes - the work container info isn't used
+//    @ToString.Exclude
+//    private final NavigableMap<Long, WorkContainer<K, V>> commitQueue = new ConcurrentSkipListMap<>();
+
+//    private NavigableMap<Long, WorkContainer<K, V>> getCommitQueue() {
+//        return Collections.unmodifiableNavigableMap(commitQueue);
+//    }
+
+    public PartitionState(PCModule<K, V> pcModule, TopicPartition topicPartition, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
+        this.tp = topicPartition;
+        this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
 
-    private NavigableMap<Long, WorkContainer<K, V>> getCommitQueue() {
-        return Collections.unmodifiableNavigableMap(commitQueue);
-    }
+//        this.incompleteOffsets = new ConcurrentSkipListSet<>();
+//        offsetData.getIncompleteOffsets().stream()
+//                .map(offset -> new OffsetContainerPair(offset, Optional.empty()))
+//                .forEach(incompleteOffsets::add);
+
+        this.incompleteOffsets = new ConcurrentSkipListMap<>();
+        offsetData.getIncompleteOffsets()
+                .forEach(offset -> incompleteOffsets.put(offset, Optional.empty()));
 
-    public PartitionState(TopicPartition tp, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
-        this.tp = tp;
-        this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
-        this.incompleteOffsets = new ConcurrentSkipListSet<>(offsetData.getIncompleteOffsets());
         this.offsetHighestSucceeded = this.offsetHighestSeen;
         this.sm = null;
         this.module = pcModule;
@@ -197,7 +216,7 @@ private void setDirty() {
     // todo add support for this to TruthGen
     public boolean isRecordPreviouslyCompleted(final ConsumerRecord<K, V> rec) {
         long recOffset = rec.offset();
-        if (incompleteOffsets.contains(recOffset)) {
+        if (incompleteOffsets.containsKey(recOffset)) {
             // we haven't recorded this far up, so must not have been processed yet
             return false;
         } else {
@@ -206,24 +225,20 @@ public boolean isRecordPreviouslyCompleted(final ConsumerRecord<K, V> rec) {
         }
     }
 
-    public boolean hasWorkInCommitQueue() {
-        return !commitQueue.isEmpty();
+    public boolean hasIncompleteOffsets() {
+        return !incompleteOffsets.isEmpty();
     }
 
-    public int getCommitQueueSize() {
-        return commitQueue.size();
+    public int getNumberOfIncompleteOffsets() {
+        return incompleteOffsets.size();
     }
 
-    public void onSuccess(WorkContainer<K, V> work) {
-        long offset = work.offset();
-
-        WorkContainer<K, V> removedFromQueue = this.commitQueue.remove(offset);
-        assert (removedFromQueue != null);
-
-        boolean removedFromIncompletes = this.incompleteOffsets.remove(offset);
+    public void onSuccess(long offset) {
+        //noinspection OptionalAssignedToNull - null check to see if key existed
+        boolean removedFromIncompletes = this.incompleteOffsets.remove(offset) != null; // NOSONAR
         assert (removedFromIncompletes);
 
-        updateHighestSucceededOffsetSoFar(work);
+        updateHighestSucceededOffsetSoFar(offset);
 
         setDirty();
     }
@@ -235,9 +250,8 @@ public void onFailure(WorkContainer<K, V> work) {
     /**
      * Update highest Succeeded seen so far
      */
-    private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
+    private void updateHighestSucceededOffsetSoFar(long thisOffset) {
         long highestSucceeded = getOffsetHighestSucceeded();
-        long thisOffset = work.offset();
         if (thisOffset > highestSucceeded) {
             log.trace("Updating highest completed - was: {} now: {}", highestSucceeded, thisOffset);
             this.offsetHighestSucceeded = thisOffset;
@@ -266,11 +280,8 @@ public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.Re
             if (isRecordPreviouslyCompleted(aRecord)) {
                 log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
             } else {
-                //noinspection ObjectAllocationInLoop
-                var work = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
-
-                sm.addWorkContainer(work);
-                addNewIncompleteWorkContainer(work);
+                sm.addWorkContainer(epochOfInboundRecords, aRecord);
+                addNewIncompleteRecord(aRecord);
             }
         }
 
@@ -280,14 +291,12 @@ public boolean isPartitionRemovedOrNeverAssigned() {
         return false;
     }
 
-    public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
-        long newOffset = wc.offset();
-
-        maybeRaiseHighestSeenOffset(newOffset);
-        commitQueue.put(newOffset, wc);
+    public void addNewIncompleteRecord(ConsumerRecord<K, V> record) {
+        long offset = record.offset();
+        maybeRaiseHighestSeenOffset(offset);
 
         // idempotently add the offset to our incompletes track - if it was already there from loading our metadata on startup, there is no affect
-        incompleteOffsets.add(newOffset);
+        incompleteOffsets.put(offset, Optional.of(record));
     }
 
     /**
@@ -324,18 +333,20 @@ protected long getNextExpectedInitialPolledOffset() {
     /**
      * @return all incomplete offsets of buffered work in this shard, even if higher than the highest succeeded
      */
+    // todo change to list
     public Set<Long> getAllIncompleteOffsets() {
         //noinspection FuseStreamOperations - only in java 10
-        return Collections.unmodifiableSet(incompleteOffsets.parallelStream().collect(Collectors.toSet()));
+        return Collections.unmodifiableSet(incompleteOffsets.keySet().parallelStream().collect(Collectors.toSet()));
     }
 
     /**
      * @return incomplete offsets which are lower than the highest succeeded
      */
+    // todo change to list
     public Set<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         long highestSucceeded = getOffsetHighestSucceeded();
         //noinspection FuseStreamOperations Collectors.toUnmodifiableSet since v10
-        return Collections.unmodifiableSet(incompleteOffsets.parallelStream()
+        return Collections.unmodifiableSet(incompleteOffsets.keySet().parallelStream()
                 // todo less than or less than and equal?
                 .filter(x -> x < highestSucceeded).collect(Collectors.toSet()));
     }
@@ -357,7 +368,7 @@ public long getOffsetHighestSequentialSucceeded() {
          * See #200 for the complete correct solution.
          */
         long currentOffsetHighestSeen = offsetHighestSeen;
-        Long firstIncompleteOffset = incompleteOffsets.ceiling(KAFKA_OFFSET_ABSENCE);
+        Long firstIncompleteOffset = incompleteOffsets.keySet().ceiling(KAFKA_OFFSET_ABSENCE);
         boolean incompleteOffsetsWasEmpty = firstIncompleteOffset == null;
 
         if (incompleteOffsetsWasEmpty) {
@@ -428,7 +439,7 @@ private double getPressureThresholdValue() {
     }
 
     public void onPartitionsRemoved(ShardManager<K, V> sm) {
-        sm.removeAnyShardsReferencedBy(getCommitQueue());
+        sm.removeAnyShardEntriesReferencedFrom(incompleteOffsets.values());
     }
 
     /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 8996ee0d8..e3e39d3b3 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -231,18 +231,18 @@ public boolean isAllowedMoreRecords(WorkContainer<?, ?> wc) {
         return isAllowedMoreRecords(wc.getTopicPartition());
     }
 
-    public boolean hasWorkInCommitQueues() {
+    public boolean hasIncompleteOffsets() {
         for (var partition : getAssignedPartitions().values()) {
-            if (partition.hasWorkInCommitQueue())
+            if (partition.hasIncompleteOffsets())
                 return true;
         }
         return false;
     }
 
-    public long getNumberOfEntriesInPartitionQueues() {
+    public long getNumberOfIncompleteOffsets() {
         Collection<PartitionState<K, V>> values = getAssignedPartitions().values();
         return values.stream()
-                .mapToLong(PartitionState::getCommitQueueSize)
+                .mapToLong(PartitionState::getNumberOfIncompleteOffsets)
                 .reduce(Long::sum)
                 .orElse(0);
     }
@@ -253,7 +253,7 @@ public long getHighestSeenOffset(final TopicPartition tp) {
 
     public void onSuccess(WorkContainer<K, V> wc) {
         PartitionState<K, V> partitionState = getPartitionState(wc.getTopicPartition());
-        partitionState.onSuccess(wc);
+        partitionState.onSuccess(wc.offset());
     }
 
     public void onFailure(WorkContainer<K, V> wc) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index d61bd9683..62eebce7d 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -105,12 +105,12 @@ public boolean isRecordPreviouslyCompleted(final ConsumerRecord<K, V> rec) {
     }
 
     @Override
-    public boolean hasWorkInCommitQueue() {
+    public boolean hasIncompleteOffsets() {
         return false;
     }
 
     @Override
-    public int getCommitQueueSize() {
+    public int getNumberOfIncompleteOffsets() {
         return 0;
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
index 08a52f056..296cd04b1 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
@@ -9,14 +9,17 @@
 import io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder;
 import io.confluent.parallelconsumer.internal.AbstractParallelEoSStreamProcessor;
 import io.confluent.parallelconsumer.internal.BrokerPollSystem;
+import io.confluent.parallelconsumer.internal.PCModule;
 import lombok.Getter;
 import lombok.RequiredArgsConstructor;
 import lombok.extern.slf4j.Slf4j;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.common.TopicPartition;
 
 import java.time.Duration;
 import java.util.*;
 import java.util.concurrent.ConcurrentHashMap;
+import java.util.stream.Collectors;
 
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static java.util.Optional.empty;
@@ -35,8 +38,10 @@
 @RequiredArgsConstructor
 public class ShardManager<K, V> {
 
+    private final PCModule<K, V> module;
+
     @Getter
-    private final ParallelConsumerOptions options;
+    private final ParallelConsumerOptions<?, ?> options;
 
     private final WorkManager<K, V> wm;
 
@@ -79,6 +84,10 @@ ShardKey computeShardKey(WorkContainer<?, ?> wc) {
         return ShardKey.of(wc, options.getOrdering());
     }
 
+    ShardKey computeShardKey(ConsumerRecord<?, ?> wc) {
+        return ShardKey.of(wc, options.getOrdering());
+    }
+
     /**
      * @return Work ready in the processing shards, awaiting selection as work to do
      */
@@ -97,30 +106,33 @@ public boolean workIsWaitingToBeProcessed() {
     /**
      * Remove only the work shards which are referenced from work from revoked partitions
      *
-     * @param workFromRemovedPartition collection of work to scan to get keys of shards to remove
+     * @param recordsFromRemovedPartition collection of work to scan to get keys of shards to remove
      */
-    void removeAnyShardsReferencedBy(NavigableMap<Long, WorkContainer<K, V>> workFromRemovedPartition) {
-        for (WorkContainer<K, V> work : workFromRemovedPartition.values()) {
+    void removeAnyShardEntriesReferencedFrom(Collection<Optional<ConsumerRecord<K, V>>> recordsFromRemovedPartition) {
+        for (ConsumerRecord<K, V> work : recordsFromRemovedPartition.stream()
+                .filter(Optional::isPresent)
+                .map(Optional::get)
+                .collect(Collectors.toList())) {
             removeShardFor(work);
         }
     }
 
-    private void removeShardFor(final WorkContainer<K, V> work) {
-        ShardKey shardKey = computeShardKey(work);
+    private void removeShardFor(ConsumerRecord<K, V> consumerRecord) {
+        ShardKey shardKey = computeShardKey(consumerRecord);
 
         if (processingShards.containsKey(shardKey)) {
             ProcessingShard<K, V> shard = processingShards.get(shardKey);
-            shard.remove(work.offset());
+            WorkContainer<K, V> removedWC = shard.remove(consumerRecord.offset());
             removeShardIfEmpty(shardKey);
+            // remove if in retry queue
+            this.retryQueue.remove(removedWC);
         } else {
-            log.trace("Shard referenced by WC: {} with shard key: {} already removed", work, shardKey);
+            log.trace("Shard referenced by WC: {} with shard key: {} already removed", consumerRecord, shardKey);
         }
-
-        //
-        this.retryQueue.remove(work);
     }
 
-    public void addWorkContainer(WorkContainer<K, V> wc) {
+    public void addWorkContainer(long epochOfInboundRecords, ConsumerRecord<K, V> aRecord) {
+        var wc = new WorkContainer<>(epochOfInboundRecords, aRecord, module);
         ShardKey shardKey = computeShardKey(wc);
         var shard = processingShards.computeIfAbsent(shardKey,
                 ignore -> new ProcessingShard<>(shardKey, options, wm.getPm()));
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
index cb5150e4e..e7dd88c8a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
@@ -143,7 +143,7 @@ public List<WorkContainer<K, V>> getWorkIfAvailable(final int requestedMaxWorkTo
                 work.size(),
                 requestedMaxWorkToRetrieve,
                 getNumberRecordsOutForProcessing(),
-                getNumberOfEntriesInPartitionQueues());
+                getNumberOfIncompleteOffsets());
         numberRecordsOutForProcessing += work.size();
 
         return work;
@@ -181,8 +181,8 @@ public void onFailureResult(WorkContainer<K, V> wc) {
         numberRecordsOutForProcessing--;
     }
 
-    public long getNumberOfEntriesInPartitionQueues() {
-        return pm.getNumberOfEntriesInPartitionQueues();
+    public long getNumberOfIncompleteOffsets() {
+        return pm.getNumberOfIncompleteOffsets();
     }
 
     public Map<TopicPartition, OffsetAndMetadata> collectCommitDataForDirtyPartitions() {
@@ -243,20 +243,14 @@ public long getNumberOfWorkQueuedInShardsAwaitingSelection() {
         return sm.getNumberOfWorkQueuedInShardsAwaitingSelection();
     }
 
-    public boolean hasWorkInCommitQueues() {
-        return pm.hasWorkInCommitQueues();
+    public boolean hasIncompleteOffsets() {
+        return pm.hasIncompleteOffsets();
     }
 
     public boolean isRecordsAwaitingProcessing() {
         return sm.getNumberOfWorkQueuedInShardsAwaitingSelection() > 0;
     }
 
-    public boolean isRecordsAwaitingToBeCommitted() {
-        // todo could be improved - shouldn't need to count all entries if we simply want to know if there's > 0
-        var partitionWorkRemainingCount = getNumberOfEntriesInPartitionQueues();
-        return partitionWorkRemainingCount > 0;
-    }
-
     public void handleFutureResult(WorkContainer<K, V> wc) {
         if (checkIfWorkIsStale(wc)) {
             // no op, partition has been revoked
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
index 5469c6335..c9f5b6383 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
@@ -90,7 +90,7 @@ void setupMock() {
     private void injectSucceededWorkAtOffset(long offset) {
         WorkContainer<String, String> workContainer = new WorkContainer<>(0, mockCr, mock(PCModuleTestEnv.class));
         Mockito.doReturn(offset).when(mockCr).offset();
-        state.addNewIncompleteWorkContainer(workContainer);
+        state.addNewIncompleteRecord(offset);
         state.onSuccess(workContainer); // in this case the highest seen is also the highest succeeded
     }
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
index d2b750e00..4495c9c74 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
@@ -633,7 +633,7 @@ void workQueuesEmptyWhenAllWorkComplete() {
 
         //
         assertThat(wm.getSm().getNumberOfWorkQueuedInShardsAwaitingSelection()).isZero();
-        assertThat(wm.getNumberOfEntriesInPartitionQueues()).as("Partition commit queues are now empty").isZero();
+        assertThat(wm.getNumberOfIncompleteOffsets()).as("Partition commit queues are now empty").isZero();
 
         // drain commit queue
         var completedFutureOffsets = wm.collectCommitDataForDirtyPartitions();

From 214605ebbc50768051b66b00efa71ea1e2f20cff Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 6 Oct 2022 15:48:14 +0100
Subject: [PATCH 090/131] compiles

---
 .../offsets/OffsetMapCodecManager.java        | 22 ++++++++++---------
 .../state/PartitionStateManager.java          |  2 +-
 .../state/RemovedPartitionState.java          | 14 ++++++------
 .../parallelconsumer/state/ShardManager.java  |  8 +++++--
 .../parallelconsumer/state/WorkManager.java   |  2 +-
 .../offsets/OffsetEncodingTests.java          |  5 ++++-
 .../WorkManagerOffsetMapCodecManagerTest.java | 10 +++++----
 .../parallelconsumer/state/ModelUtils.java    |  1 +
 .../state/PartitionStateTest.java             |  2 +-
 9 files changed, 39 insertions(+), 27 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
index 83c050224..f4dfd047a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
@@ -5,6 +5,7 @@
  */
 
 import io.confluent.parallelconsumer.internal.InternalRuntimeError;
+import io.confluent.parallelconsumer.internal.PCModule;
 import io.confluent.parallelconsumer.state.PartitionState;
 import lombok.Value;
 import lombok.extern.slf4j.Slf4j;
@@ -20,8 +21,8 @@
 import static java.nio.charset.StandardCharsets.UTF_8;
 
 /**
- * Uses multiple encodings to compare, when decided, can refactor other options out for analysis only - {@link
- * #encodeOffsetsCompressed}
+ * Uses multiple encodings to compare, when decided, can refactor other options out for analysis only -
+ * {@link #encodeOffsetsCompressed}
  * <p>
  * TODO: consider IO exception management - question sneaky throws usage?
  * <p>
@@ -48,15 +49,16 @@ public class OffsetMapCodecManager<K, V> {
     /**
      * Maximum size of the commit offset metadata
      *
-     * @see <a href="https://github.com/apache/kafka/blob/9bc9a37e50e403a356a4f10d6df12e9f808d4fba/core/src/main/scala/kafka/coordinator/group/OffsetConfig.scala#L52">OffsetConfig#DefaultMaxMetadataSize</a>
+     * @see <a
+     *         href="https://github.com/apache/kafka/blob/9bc9a37e50e403a356a4f10d6df12e9f808d4fba/core/src/main/scala/kafka/coordinator/group/OffsetConfig.scala#L52">OffsetConfig#DefaultMaxMetadataSize</a>
      * @see "kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize"
      */
+    // todo refactored to constant in the remove statics branch
     public static int DefaultMaxMetadataSize = 4096;
 
     public static final Charset CHARSET_TO_USE = UTF_8;
 
-    // todo OffsetMapCodecManager needs refactoring - consumer presence here smells bad #233
-    org.apache.kafka.clients.consumer.Consumer<K, V> consumer;
+    private final PCModule module;
 
     /**
      * Decoding result for encoded offsets
@@ -94,8 +96,8 @@ public static HighestOffsetAndIncompletes of() {
     public static Optional<OffsetEncoding> forcedCodec = Optional.empty();
 
     // todo remove consumer #233
-    public OffsetMapCodecManager(final org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
-        this.consumer = consumer;
+    public OffsetMapCodecManager(PCModule<K, V> module) {
+        this.module = module;
     }
 
     /**
@@ -112,7 +114,7 @@ public Map<TopicPartition, PartitionState<K, V>> loadPartitionStateForAssignment
         while (partitionLastCommittedOffsets == null) {
             WakeupException lastWakeupException = null;
             try {
-                partitionLastCommittedOffsets = consumer.committed(new HashSet<>(assignment));
+                partitionLastCommittedOffsets = module.consumer().committed(new HashSet<>(assignment));
             } catch (WakeupException exception) {
                 log.debug("Woken up trying to get assignment", exception);
                 lastWakeupException = exception;
@@ -141,7 +143,7 @@ public Map<TopicPartition, PartitionState<K, V>> loadPartitionStateForAssignment
         assignment.stream()
                 .filter(topicPartition -> !partitionStates.containsKey(topicPartition))
                 .forEach(topicPartition -> {
-                    PartitionState<K, V> defaultEntry = new PartitionState<>(topicPartition, HighestOffsetAndIncompletes.of());
+                    PartitionState<K, V> defaultEntry = new PartitionState<>(module, topicPartition, HighestOffsetAndIncompletes.of());
                     partitionStates.put(topicPartition, defaultEntry);
                 });
 
@@ -165,7 +167,7 @@ public static HighestOffsetAndIncompletes deserialiseIncompleteOffsetMapFromBase
     PartitionState<K, V> decodePartitionState(TopicPartition tp, OffsetAndMetadata offsetData) throws OffsetDecodingError {
         HighestOffsetAndIncompletes incompletes = deserialiseIncompleteOffsetMapFromBase64(offsetData);
         log.debug("Loaded incomplete offsets from offset payload {}", incompletes);
-        return new PartitionState<>(tp, incompletes);
+        return new PartitionState<>(module, tp, incompletes);
     }
 
     public String makeOffsetMetadataPayload(long baseOffsetForPartition, PartitionState<K, V> state) throws NoEncodingPossibleException {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index e3e39d3b3..1a8831a30 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -112,7 +112,7 @@ public void onPartitionsAssigned(Collection<TopicPartition> assignedPartitions)
         incrementPartitionAssignmentEpoch(assignedPartitions);
 
         try {
-            OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(this.consumer); // todo remove throw away instance creation - #233
+            OffsetMapCodecManager<K, V> om = new OffsetMapCodecManager<>(module); // todo remove throw away instance creation - #233
             var partitionStates = om.loadPartitionStateForAssignment(assignedPartitions);
             this.partitionStates.putAll(partitionStates);
         } catch (Exception e) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index 62eebce7d..32f53d185 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -38,7 +38,7 @@ public class RemovedPartitionState<K, V> extends PartitionState<K, V> {
     public static final String NO_OP = "no-op";
 
     public RemovedPartitionState() {
-        super(null, OffsetMapCodecManager.HighestOffsetAndIncompletes.of());
+        super(null, null, OffsetMapCodecManager.HighestOffsetAndIncompletes.of());
     }
 
     public static PartitionState getSingleton() {
@@ -115,12 +115,12 @@ public int getNumberOfIncompleteOffsets() {
     }
 
     @Override
-    public void onSuccess(final WorkContainer<K, V> work) {
-        log.debug("Dropping completed work container for partition no longer assigned. WC: {}, partition: {}", work, work.getTopicPartition());
+    public void onSuccess(long offset) {
+        log.debug("Dropping completed work container for partition no longer assigned. WC: {}, partition: {}", offset, getTp());
     }
 
-//    @Override
-//    public boolean isPartitionRemovedOrNeverAssigned() {
-//        return true;
-//    }
+    @Override
+    public boolean isPartitionRemovedOrNeverAssigned() {
+        return true;
+    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
index 296cd04b1..0b1eef255 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/ShardManager.java
@@ -11,7 +11,6 @@
 import io.confluent.parallelconsumer.internal.BrokerPollSystem;
 import io.confluent.parallelconsumer.internal.PCModule;
 import lombok.Getter;
-import lombok.RequiredArgsConstructor;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.common.TopicPartition;
@@ -35,7 +34,6 @@
  * must be thread safe.
  */
 @Slf4j
-@RequiredArgsConstructor
 public class ShardManager<K, V> {
 
     private final PCModule<K, V> module;
@@ -67,6 +65,12 @@ public class ShardManager<K, V> {
      */
     private Optional<ShardKey> iterationResumePoint = Optional.empty();
 
+    public ShardManager(final PCModule<K, V> module, final WorkManager<K, V> wm) {
+        this.module = module;
+        this.wm = wm;
+        this.options = module.options();
+    }
+
     /**
      * The shard belonging to the given key
      *
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
index e7dd88c8a..8e1e70857 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
@@ -77,7 +77,7 @@ public WorkManager(PCModule<K, V> module,
                        DynamicLoadFactor dynamicExtraLoadFactor) {
         this.options = module.options();
         this.dynamicLoadFactor = dynamicExtraLoadFactor;
-        this.sm = new ShardManager<>(options, this);
+        this.sm = new ShardManager<>(module, this);
         this.pm = new PartitionStateManager<>(module, sm);
     }
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
index ad60621ee..609d8283a 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
@@ -10,6 +10,7 @@
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessorTestBase;
 import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import io.confluent.parallelconsumer.internal.PCModule;
+import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.state.WorkContainer;
 import io.confluent.parallelconsumer.state.WorkManager;
 import lombok.SneakyThrows;
@@ -42,6 +43,8 @@
 @Slf4j
 public class OffsetEncodingTests extends ParallelEoSStreamProcessorTestBase {
 
+    PCModuleTestEnv module = new PCModuleTestEnv();
+
     @Test
     void runLengthDeserialise() {
         var sb = ByteBuffer.allocate(3);
@@ -202,7 +205,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
             {
                 // check for graceful fall back to the smallest available encoder
-                OffsetMapCodecManager<String, String> om = new OffsetMapCodecManager<>(consumerSpy);
+                OffsetMapCodecManager<String, String> om = new OffsetMapCodecManager<>(module);
                 OffsetMapCodecManager.forcedCodec = Optional.empty(); // turn off forced
                 var state = wmm.getPm().getPartitionState(tp);
                 String bestPayload = om.makeOffsetMetadataPayload(1, state);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
index c9f5b6383..a008f56a3 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
@@ -54,6 +54,8 @@
 @ExtendWith(MockitoExtension.class)
 class WorkManagerOffsetMapCodecManagerTest {
 
+    PCModuleTestEnv module = new PCModuleTestEnv();
+
     WorkManager<String, String> wm;
 
     OffsetMapCodecManager<String, String> offsetCodecManager;
@@ -77,7 +79,7 @@ class WorkManagerOffsetMapCodecManagerTest {
      */
     long highestSucceeded = 4;
 
-    PartitionState<String, String> state = new PartitionState<>(tp, new OffsetMapCodecManager.HighestOffsetAndIncompletes(of(highestSucceeded), incompleteOffsets));
+    PartitionState<String, String> state = new PartitionState<>(module, tp, new OffsetMapCodecManager.HighestOffsetAndIncompletes(of(highestSucceeded), incompleteOffsets));
 
     @Mock
     ConsumerRecord<String, String> mockCr;
@@ -90,8 +92,8 @@ void setupMock() {
     private void injectSucceededWorkAtOffset(long offset) {
         WorkContainer<String, String> workContainer = new WorkContainer<>(0, mockCr, mock(PCModuleTestEnv.class));
         Mockito.doReturn(offset).when(mockCr).offset();
-        state.addNewIncompleteRecord(offset);
-        state.onSuccess(workContainer); // in this case the highest seen is also the highest succeeded
+        state.addNewIncompleteRecord(mockCr);
+        state.onSuccess(offset); // in this case the highest seen is also the highest succeeded
     }
 
     /**
@@ -125,7 +127,7 @@ void setup() {
                 .build();
         wm = new WorkManager<>(new PCModule<>(options));
         wm.onPartitionsAssigned(UniLists.of(tp));
-        offsetCodecManager = new OffsetMapCodecManager<>(mockConsumer);
+        offsetCodecManager = new OffsetMapCodecManager<>(module);
     }
 
     @BeforeAll
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
index a3ecd025f..36e56af8c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
@@ -24,6 +24,7 @@
 @RequiredArgsConstructor
 public class ModelUtils {
 
+    @Getter
     private final PCModuleTestEnv module;
 
     public WorkContainer<String, String> createWorkFor(long offset) {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
index d2285bdce..5994957a1 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
@@ -39,7 +39,7 @@ void bootstrapTruncation() {
 
         HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(100L), new HashSet<>(incompletes)); // todo fix set/list
 
-        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+        PartitionState<String, String> state = new PartitionState<>(mu.getModule(), tp, offsetData);
 
 
         var w20 = mu.createWorkFor(unexpectedlyHighOffset);

From 381d6997b5d79cba4d5d89b0adc8dc229ef1411e Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 6 Oct 2022 15:50:21 +0100
Subject: [PATCH 091/131] delete

---
 .../state/PartitionState.java                 | 43 +++----------------
 1 file changed, 7 insertions(+), 36 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index dfd6bd3c1..d0d0a9a07 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -60,6 +60,11 @@ public class PartitionState<K, V> {
      * Offsets beyond the highest committable offset (see {@link #getOffsetHighestSequentialSucceeded()}) which haven't
      * totally succeeded. Based on decoded metadata and polled records (not offset ranges).
      * <p>
+     * Mapped to the corresponding {@link ConsumerRecord}, once it's been polled from the broker.
+     * <p>
+     * Initially mapped to an empty optional, until the record is polled from the broker, because we initially get only
+     * the incomplete offsets decoded from the metadata payload first, before receiving the records from poll requests.
+     * <p>
      * <p>
      * <h2>How does this handle gaps in the offsets in the source partitions?:</h2>
      * <p>
@@ -94,21 +99,7 @@ public class PartitionState<K, V> {
      * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
      *         storage
      */
-//    private ConcurrentSkipListSet<Long> incompleteOffsets;
     private final ConcurrentSkipListMap<Long, Optional<ConsumerRecord<K, V>>> incompleteOffsets;
-//    private final ConcurrentSkipListSet<OffsetContainerPair> incompleteOffsets;
-
-//    @Data
-//    @AllArgsConstructor
-//    protected class OffsetContainerPair implements Comparable<Long> {
-//        Long offset;
-//        Optional<ConsumerRecord<K, V>> workContainer;
-//
-//        @Override
-//        public int compareTo(@NonNull final Long o) {
-//            return offset.compareTo(o);
-//        }
-//    }
 
     /**
      * Marker for the first record to be tracked. Used for some initial analysis.
@@ -158,38 +149,18 @@ public class PartitionState<K, V> {
     @Setter(PRIVATE)
     private boolean allowedMoreRecords = true;
 
-//    /**
-//     * Map of offsets to {@link WorkContainer}s.
-//     * <p>
-//     * Concurrent because either the broker poller thread or the control thread may be requesting offset to commit
-//     * ({@link #getCommitDataIfDirty()}), or reading upon {@link #onPartitionsRemoved}. This requirement is removed in
-//     * the upcoming PR #200 Refactor: Consider a shared nothing * architecture.
-//     */
-//    // todo rename - it's not a queue of things to be committed - it's a collection of incomplete offsets and their WorkContainers
-//    // todo delete? seems this can be replaced by #incompletes - the work container info isn't used
-//    @ToString.Exclude
-//    private final NavigableMap<Long, WorkContainer<K, V>> commitQueue = new ConcurrentSkipListMap<>();
-
-//    private NavigableMap<Long, WorkContainer<K, V>> getCommitQueue() {
-//        return Collections.unmodifiableNavigableMap(commitQueue);
-//    }
-
     public PartitionState(PCModule<K, V> pcModule, TopicPartition topicPartition, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.tp = topicPartition;
         this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
 
-//        this.incompleteOffsets = new ConcurrentSkipListSet<>();
-//        offsetData.getIncompleteOffsets().stream()
-//                .map(offset -> new OffsetContainerPair(offset, Optional.empty()))
-//                .forEach(incompleteOffsets::add);
-
         this.incompleteOffsets = new ConcurrentSkipListMap<>();
         offsetData.getIncompleteOffsets()
                 .forEach(offset -> incompleteOffsets.put(offset, Optional.empty()));
 
         this.offsetHighestSucceeded = this.offsetHighestSeen;
-        this.sm = null;
+
         this.module = pcModule;
+        this.sm = pcModule.workManager().getSm();
     }
 
     private void maybeRaiseHighestSeenOffset(final long offset) {

From d8f8a92c025ff2b139db8efd0b2275bbb1bb66f4 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Thu, 6 Oct 2022 16:05:44 +0100
Subject: [PATCH 092/131] START:EXP: try changing set to list

---
 .../offsets/OffsetSimultaneousEncoder.java      |  9 +++++----
 .../parallelconsumer/state/PartitionState.java  | 17 +++++++++--------
 .../state/RemovedPartitionState.java            | 12 ++++++++----
 3 files changed, 22 insertions(+), 16 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index 82e4ab738..c3932b220 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -35,10 +35,11 @@ public class OffsetSimultaneousEncoder {
     public static final int LARGE_INPUT_MAP_SIZE_THRESHOLD = 200;
 
     /**
-     * The offsets which have not yet been fully completed and can't have their offset committed
+     * The offsets which have not yet been fully completed and can't have their offset committed - only used to test
+     * with {@link Set#contains} (no order requirement, but {@link SortedSet} just in case).
      */
     @Getter
-    private final Set<Long> incompleteOffsets;
+    private final SortedSet<Long> incompleteOffsets;
 
     /**
      * The lowest committable offset
@@ -84,9 +85,9 @@ public class OffsetSimultaneousEncoder {
      */
     private final Set<OffsetEncoder> encoders;
 
-    public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededOffset, Set<Long> incompleteOffsets) {
+    public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededOffset, List<Long> incompleteOffsets) {
         this.lowWaterMark = baseOffsetToCommit;
-        this.incompleteOffsets = incompleteOffsets;
+        this.incompleteOffsets = new TreeSet<>(incompleteOffsets);
 
         //
         if (highestSucceededOffset == -1) { // nothing succeeded yet
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index d0d0a9a07..d1eba52a6 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -18,7 +18,10 @@
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 
-import java.util.*;
+import java.util.Collections;
+import java.util.List;
+import java.util.Objects;
+import java.util.Optional;
 import java.util.concurrent.ConcurrentSkipListMap;
 import java.util.stream.Collectors;
 
@@ -304,22 +307,20 @@ protected long getNextExpectedInitialPolledOffset() {
     /**
      * @return all incomplete offsets of buffered work in this shard, even if higher than the highest succeeded
      */
-    // todo change to list
-    public Set<Long> getAllIncompleteOffsets() {
+    public List<Long> getAllIncompleteOffsets() {
         //noinspection FuseStreamOperations - only in java 10
-        return Collections.unmodifiableSet(incompleteOffsets.keySet().parallelStream().collect(Collectors.toSet()));
+        return Collections.unmodifiableList(incompleteOffsets.keySet().parallelStream().collect(Collectors.toList()));
     }
 
     /**
      * @return incomplete offsets which are lower than the highest succeeded
      */
-    // todo change to list
-    public Set<Long> getIncompleteOffsetsBelowHighestSucceeded() {
+    public List<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         long highestSucceeded = getOffsetHighestSucceeded();
         //noinspection FuseStreamOperations Collectors.toUnmodifiableSet since v10
-        return Collections.unmodifiableSet(incompleteOffsets.keySet().parallelStream()
+        return Collections.unmodifiableList(incompleteOffsets.keySet().parallelStream()
                 // todo less than or less than and equal?
-                .filter(x -> x < highestSucceeded).collect(Collectors.toSet()));
+                .filter(x -> x < highestSucceeded).collect(Collectors.toList()));
     }
 
     /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index 32f53d185..2398b1027 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -11,8 +11,12 @@
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.common.TopicPartition;
+import pl.tlinkowski.unij.api.UniLists;
 
-import java.util.*;
+import java.util.Collections;
+import java.util.List;
+import java.util.NavigableMap;
+import java.util.Optional;
 import java.util.concurrent.ConcurrentSkipListMap;
 
 /**
@@ -32,7 +36,7 @@
 public class RemovedPartitionState<K, V> extends PartitionState<K, V> {
 
     private static final NavigableMap READ_ONLY_EMPTY_MAP = Collections.unmodifiableNavigableMap(new ConcurrentSkipListMap<>());
-    private static final Set READ_ONLY_EMPTY_SET = Collections.unmodifiableSet(new HashSet<>());
+    private static final List READ_ONLY_EMPTY_LIST = Collections.unmodifiableList(UniLists.of());
 
     private static final PartitionState singleton = new RemovedPartitionState();
     public static final String NO_OP = "no-op";
@@ -80,10 +84,10 @@ boolean isAllowedMoreRecords() {
     }
 
     @Override
-    public Set<Long> getIncompleteOffsetsBelowHighestSucceeded() {
+    public List<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         log.debug(NO_OP);
         //noinspection unchecked - by using unsave generics, we are able to share one static instance
-        return READ_ONLY_EMPTY_SET;
+        return READ_ONLY_EMPTY_LIST;
     }
 
     @Override

From 7ada9918cb639a868fbc0d3a0cacd3c0ea4eeb98 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 7 Oct 2022 15:58:04 +0100
Subject: [PATCH 093/131] step: push TreeSet construction up to source for not
 change in efficiency

---
 .../java/io/confluent/csid/utils/JavaUtils.java |  9 +++++----
 .../offsets/OffsetMapCodecManager.java          |  2 +-
 .../offsets/OffsetSimultaneousEncoder.java      |  4 ++--
 .../parallelconsumer/state/PartitionState.java  | 15 ++++++---------
 .../state/RemovedPartitionState.java            | 17 +++++++----------
 .../offsets/BitSetEncodingTest.java             |  8 +++-----
 .../offsets/OffsetCodecTestUtils.java           |  6 +++---
 .../offsets/OffsetEncodingTests.java            |  5 ++---
 .../offsets/RunLengthEncoderTest.java           | 13 +++++++------
 .../WorkManagerOffsetMapCodecManagerTest.java   |  8 ++++----
 10 files changed, 40 insertions(+), 47 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
index 37e56237d..914bbb0cb 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
@@ -8,11 +8,9 @@
 import lombok.experimental.UtilityClass;
 
 import java.time.Duration;
-import java.util.Collection;
-import java.util.List;
-import java.util.Map;
-import java.util.Optional;
+import java.util.*;
 import java.util.function.Function;
+import java.util.stream.Collector;
 import java.util.stream.Collectors;
 
 import static java.time.Duration.ofMillis;
@@ -60,4 +58,7 @@ public static <K, V1, V2> Map<K, V2> remap(Map<K, V1> map,
                 ));
     }
 
+    public static <T> Collector<T, ?, TreeSet<T>> toTreeSet() {
+        return Collectors.toCollection(TreeSet::new);
+    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
index f4dfd047a..0d518b52c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
@@ -196,7 +196,7 @@ byte[] encodeOffsetsCompressed(long baseOffsetForPartition, PartitionState<K, V>
             log.debug("Encoding partition {}, highest succeeded {}, incomplete offsets to encode {}",
                     partitionState.getTp(),
                     highestSucceeded,
-                    partitionState.getIncompleteOffsetsBelowHighestSucceeded());
+                    incompleteOffsets);
         }
         OffsetSimultaneousEncoder simultaneousEncoder = new OffsetSimultaneousEncoder(baseOffsetForPartition, highestSucceeded, incompleteOffsets).invoke();
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index c3932b220..91e3d290a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -85,9 +85,9 @@ public class OffsetSimultaneousEncoder {
      */
     private final Set<OffsetEncoder> encoders;
 
-    public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededOffset, List<Long> incompleteOffsets) {
+    public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededOffset, SortedSet<Long> incompleteOffsets) {
         this.lowWaterMark = baseOffsetToCommit;
-        this.incompleteOffsets = new TreeSet<>(incompleteOffsets);
+        this.incompleteOffsets = incompleteOffsets;
 
         //
         if (highestSucceededOffset == -1) { // nothing succeeded yet
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index d1eba52a6..9b1f3e930 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -18,13 +18,11 @@
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
 
-import java.util.Collections;
-import java.util.List;
-import java.util.Objects;
-import java.util.Optional;
+import java.util.*;
 import java.util.concurrent.ConcurrentSkipListMap;
 import java.util.stream.Collectors;
 
+import static io.confluent.csid.utils.JavaUtils.toTreeSet;
 import static io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.DefaultMaxMetadataSize;
 import static java.util.Optional.empty;
 import static java.util.Optional.of;
@@ -315,12 +313,11 @@ public List<Long> getAllIncompleteOffsets() {
     /**
      * @return incomplete offsets which are lower than the highest succeeded
      */
-    public List<Long> getIncompleteOffsetsBelowHighestSucceeded() {
+    public SortedSet<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         long highestSucceeded = getOffsetHighestSucceeded();
-        //noinspection FuseStreamOperations Collectors.toUnmodifiableSet since v10
-        return Collections.unmodifiableList(incompleteOffsets.keySet().parallelStream()
-                // todo less than or less than and equal?
-                .filter(x -> x < highestSucceeded).collect(Collectors.toList()));
+        return incompleteOffsets.keySet().parallelStream()
+                .filter(x -> x < highestSucceeded)
+                .collect(toTreeSet());
     }
 
     /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index 2398b1027..df6ced785 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -11,13 +11,10 @@
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.consumer.ConsumerRecord;
 import org.apache.kafka.common.TopicPartition;
-import pl.tlinkowski.unij.api.UniLists;
 
-import java.util.Collections;
-import java.util.List;
-import java.util.NavigableMap;
 import java.util.Optional;
-import java.util.concurrent.ConcurrentSkipListMap;
+import java.util.SortedSet;
+import java.util.TreeSet;
 
 /**
  * No op version of {@link PartitionState} used for when partition assignments are removed, to avoid managing null
@@ -35,10 +32,10 @@
 @Slf4j
 public class RemovedPartitionState<K, V> extends PartitionState<K, V> {
 
-    private static final NavigableMap READ_ONLY_EMPTY_MAP = Collections.unmodifiableNavigableMap(new ConcurrentSkipListMap<>());
-    private static final List READ_ONLY_EMPTY_LIST = Collections.unmodifiableList(UniLists.of());
+    private static final SortedSet<Long> READ_ONLY_EMPTY_SET = new TreeSet<>();
+
+    private static final PartitionState singleton = new RemovedPartitionState<>();
 
-    private static final PartitionState singleton = new RemovedPartitionState();
     public static final String NO_OP = "no-op";
 
     public RemovedPartitionState() {
@@ -84,10 +81,10 @@ boolean isAllowedMoreRecords() {
     }
 
     @Override
-    public List<Long> getIncompleteOffsetsBelowHighestSucceeded() {
+    public SortedSet<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         log.debug(NO_OP);
         //noinspection unchecked - by using unsave generics, we are able to share one static instance
-        return READ_ONLY_EMPTY_LIST;
+        return READ_ONLY_EMPTY_SET;
     }
 
     @Override
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/BitSetEncodingTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/BitSetEncodingTest.java
index eb6e3dc4a..8b6dbb90d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/BitSetEncodingTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/BitSetEncodingTest.java
@@ -10,10 +10,8 @@
 import pl.tlinkowski.unij.api.UniSets;
 
 import java.nio.ByteBuffer;
-import java.util.List;
-import java.util.Set;
-import java.util.stream.Collectors;
 
+import static io.confluent.csid.utils.JavaUtils.toTreeSet;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
 import static org.assertj.core.api.Assertions.assertThat;
 
@@ -22,8 +20,8 @@ class BitSetEncodingTest {
     @SneakyThrows
     @Test
     void basic() {
-        Set<Long> incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(Collectors.toSet()); // lol - DRY!
-        List<Long> completes = UniLists.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(Collectors.toList()); // lol - DRY!
+        var incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(toTreeSet());
+        var completes = UniLists.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet());
         OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(-1, 0L, incompletes);
         int length = 11;
         BitSetEncoder bs = new BitSetEncoder(length, offsetSimultaneousEncoder, v2);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java
index 83a5efb42..20ad9b9c5 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java
@@ -8,8 +8,8 @@
 import lombok.experimental.UtilityClass;
 import lombok.extern.slf4j.Slf4j;
 
-import java.util.HashSet;
 import java.util.Set;
+import java.util.TreeSet;
 
 import static io.confluent.csid.utils.Range.range;
 
@@ -47,8 +47,8 @@ static String incompletesToBitmapString(long finalOffsetForPartition, PartitionS
      * <p>
      * o is incomplete
      */
-    static Set<Long> bitmapStringToIncomplete(final long baseOffset, final String inputBitmapString) {
-        final Set<Long> incompleteOffsets = new HashSet<>();
+    static TreeSet<Long> bitmapStringToIncomplete(final long baseOffset, final String inputBitmapString) {
+        var incompleteOffsets = new TreeSet<Long>();
 
         final long longLength = inputBitmapString.length();
         range(longLength).forEach(i -> {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
index 609d8283a..c7ac7c747 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
@@ -82,9 +82,8 @@ void runLengthDeserialise() {
     })
     @ResourceLock(value = OffsetSimultaneousEncoder.COMPRESSION_FORCED_RESOURCE_LOCK, mode = READ_WRITE)
     void largeIncompleteOffsetValues(long nextExpectedOffset) {
-        var incompletes = new HashSet<Long>();
         long lowWaterMark = 123L;
-        incompletes.addAll(UniSets.of(lowWaterMark, 2345L, 8765L));
+        var incompletes = new TreeSet<>(UniSets.of(lowWaterMark, 2345L, 8765L));
 
         OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(lowWaterMark, nextExpectedOffset, incompletes);
         OffsetSimultaneousEncoder.compressionForced = true;
@@ -319,7 +318,7 @@ private boolean assumeWorkingCodec(OffsetEncoding encoding, List<OffsetEncoding>
     void ensureEncodingGracefullyWorksWhenOffsetsArentSequentialTwo() {
         long nextExpectedOffset = 101;
         long lowWaterMark = 0;
-        var incompletes = new HashSet<>(UniSets.of(1L, 4L, 5L, 100L));
+        var incompletes = new TreeSet<>(UniSets.of(1L, 4L, 5L, 100L));
 
         OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(lowWaterMark, nextExpectedOffset, incompletes);
         OffsetSimultaneousEncoder.compressionForced = true;
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
index f839cc495..d4727da94 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
@@ -15,6 +15,7 @@
 import java.util.Set;
 import java.util.stream.Collectors;
 
+import static io.confluent.csid.utils.JavaUtils.toTreeSet;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
 import static org.assertj.core.api.Assertions.assertThat;
 
@@ -27,8 +28,8 @@ class RunLengthEncoderTest {
     @SneakyThrows
     @Test
     void noGaps() {
-        Set<Long> incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(Collectors.toSet()); // lol - DRY!
-        Set<Long> completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(Collectors.toSet()); // lol - DRY!
+        var incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(toTreeSet());
+        var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet());
         List<Integer> runs = UniLists.of(1, 3, 1, 1, 3, 1, 1);
         OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(-1, 0L, incompletes);
 
@@ -68,8 +69,8 @@ void noGaps() {
     @SneakyThrows
     @Test
     void noGapsSerialisation() {
-        Set<Long> incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(Collectors.toSet()); // lol - DRY!
-        Set<Long> completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(Collectors.toSet()); // lol - DRY!
+        var incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(toTreeSet()); // lol - DRY!
+        var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet()); // lol - DRY!
         List<Integer> runs = UniLists.of(1, 3, 1, 1, 3, 1, 1);
         OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(-1, 0L, incompletes);
 
@@ -110,10 +111,10 @@ void noGapsSerialisation() {
     @SneakyThrows
     @Test
     void gapsInOffsetsWork() {
-        Set<Long> incompletes = UniSets.of(0, 6, 10).stream().map(x -> (long) x).collect(Collectors.toSet()); // lol - DRY!
+        var incompletes = UniSets.of(0, 6, 10).stream().map(x -> (long) x).collect(toTreeSet());
 
         // NB: gaps between completed offsets get encoded as succeeded offsets. This doesn't matter because they don't exist and we'll neve see them.
-        Set<Long> completes = UniSets.of(1, 2, 3, 4, 5, 9).stream().map(x -> (long) x).collect(Collectors.toSet()); // lol - DRY!
+        Set<Long> completes = UniSets.of(1, 2, 3, 4, 5, 9).stream().map(x -> (long) x).collect(Collectors.toSet());
         List<Integer> runs = UniLists.of(1, 5, 3, 1, 1);
         OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(-1, 0L, incompletes);
 
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
index a008f56a3..7f25d40fa 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
@@ -336,9 +336,9 @@ void stringVsByteVsBitSetEncoding() {
         for (var inputString : inputsToCompress) {
             int inputLength = inputString.length();
 
-            Set<Long> longs = bitmapStringToIncomplete(finalOffsetForPartition, inputString);
+            var offsets = bitmapStringToIncomplete(finalOffsetForPartition, inputString);
 
-            OffsetSimultaneousEncoder simultaneousEncoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, highestSucceeded, longs).invoke();
+            OffsetSimultaneousEncoder simultaneousEncoder = new OffsetSimultaneousEncoder(finalOffsetForPartition, highestSucceeded, offsets).invoke();
             byte[] byteByte = simultaneousEncoder.getEncodingMap().get(ByteArray);
             byte[] bitsBytes = simultaneousEncoder.getEncodingMap().get(BitSet);
 
@@ -360,7 +360,7 @@ void deserialiseBitSet() {
         long highestSucceeded = input.length() - 1;
 
         int nextExpectedOffset = 0;
-        Set<Long> incompletes = bitmapStringToIncomplete(nextExpectedOffset, input);
+        var incompletes = bitmapStringToIncomplete(nextExpectedOffset, input);
         OffsetSimultaneousEncoder encoder = new OffsetSimultaneousEncoder(nextExpectedOffset, highestSucceeded, incompletes);
         encoder.invoke();
         byte[] pack = encoder.packSmallest();
@@ -405,7 +405,7 @@ void differentInputsAndCompressions(String input) {
 
         //
         log.debug("Testing round - size: {} input: '{}'", input.length(), input);
-        Set<Long> inputIncompletes = bitmapStringToIncomplete(finalOffsetForPartition, input);
+        var inputIncompletes = bitmapStringToIncomplete(finalOffsetForPartition, input);
         String sanityEncoding = incompletesToBitmapString(finalOffsetForPartition, highestSeen + 1, inputIncompletes);
         Truth.assertThat(sanityEncoding).isEqualTo(input);
 

From 66fe6f5e8ce8708d49e4116107a0c1011ec7fc6f Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 12:32:56 +0100
Subject: [PATCH 094/131] review

---
 .../ParallelConsumerOptions.java              |  2 +-
 .../state/PartitionState.java                 | 95 +++++++++----------
 .../state/PartitionStateManager.java          |  2 +-
 .../PartitionStateCommittedOffsetTest.java    |  4 +-
 4 files changed, 50 insertions(+), 53 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
index a26e4720e..5d871da7f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/ParallelConsumerOptions.java
@@ -32,7 +32,7 @@
 @Builder(toBuilder = true)
 @ToString
 @FieldNameConstants
-@InterfaceStability.Stable
+@InterfaceStability.Evolving
 public class ParallelConsumerOptions<K, V> {
 
     /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 8231b76c5..522cf955a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -88,9 +88,8 @@ public class PartitionState<K, V> {
     private NavigableSet<Long> incompleteOffsets;
 
     /**
-     * Marks whether any {@link WorkContainer}s have been added yet or not. Used for some initial analysis.
+     * Marks whether any {@link WorkContainer}s have been added yet or not. Used for some initial poll analysis.
      */
-    // todo rename
     private boolean bootstrapPhase = true;
 
     /**
@@ -150,10 +149,8 @@ public class PartitionState<K, V> {
      * the upcoming PR #200 Refactor: Consider a shared nothing * architecture.
      *
      * @deprecated the map structure isn't used anymore and can be replaced with the offsets tracked in
-     *         {@link #incompleteOffsets}
+     *         {@link #incompleteOffsets} - refactored future PR
      */
-    // todo rename - it's not a queue of things to be committed - it's a collection of incomplete offsets and their WorkContainers
-    // todo delete? seems this can be replaced by #incompletes - the work container info isn't used
     @ToString.Exclude
     @Deprecated
     private NavigableMap<Long, WorkContainer<K, V>> commitQueue = new ConcurrentSkipListMap<>();
@@ -165,14 +162,13 @@ private NavigableMap<Long, WorkContainer<K, V>> getCommitQueue() {
     public PartitionState(TopicPartition tp, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.tp = tp;
 
-        initState(offsetData);
+        initStateFromOffsetData(offsetData);
     }
 
-    private void initState(OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
+    private void initStateFromOffsetData(OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.offsetHighestSeen = offsetData.getHighestSeenOffset().orElse(KAFKA_OFFSET_ABSENCE);
         this.incompleteOffsets = new ConcurrentSkipListSet<>(offsetData.getIncompleteOffsets());
         this.offsetHighestSucceeded = this.offsetHighestSeen; // by definition, as we only encode up to the highest seen offset (inclusive)
-        this.nextExpectedPolledOffset = getNextExpectedInitialPolledOffset();
     }
 
     private void maybeRaiseHighestSeenOffset(final long offset) {
@@ -247,8 +243,6 @@ private void updateHighestSucceededOffsetSoFar(WorkContainer<K, V> work) {
     public void addNewIncompleteWorkContainer(WorkContainer<K, V> wc) {
         long newOffset = wc.offset();
 
-//        maybeTruncateBelowOrAbove(newOffset);
-
         maybeRaiseHighestSeenOffset(newOffset);
         commitQueue.put(newOffset, wc);
 
@@ -270,15 +264,13 @@ private void maybeTruncateBelowOrAbove(long polledOffset) {
             return;
         }
 
-//        long expectedBootstrapRecordOffset = this.getNextExpectedPolledOffset();
         long expectedBootstrapRecordOffset = getNextExpectedInitialPolledOffset();
 
+        boolean pollAboveExpected = polledOffset > expectedBootstrapRecordOffset;
 
-        boolean bootstrapPolledRecordAboveExpected = polledOffset > expectedBootstrapRecordOffset;
-
-        boolean bootstrapPolledRecordBelowExpected = polledOffset < expectedBootstrapRecordOffset;
+        boolean pollBelowExpected = polledOffset < expectedBootstrapRecordOffset;
 
-        if (bootstrapPolledRecordAboveExpected) {
+        if (pollAboveExpected) {
             // previously committed offset record has been removed, or manual reset to higher offset detected
             log.warn("Truncating state - removing records lower than {}. Offsets have been removed form the partition by the broker. Bootstrap polled {} but " +
                             "expected {} from loaded commit data. Could be caused by record retention or compaction.",
@@ -286,30 +278,24 @@ private void maybeTruncateBelowOrAbove(long polledOffset) {
                     polledOffset,
                     expectedBootstrapRecordOffset);
 
+            // truncate
             this.incompleteOffsets = incompleteOffsets.tailSet(polledOffset, true);
             this.commitQueue = commitQueue.tailMap(polledOffset, true);
-        } else if (bootstrapPolledRecordBelowExpected) {
+        } else if (pollBelowExpected) {
             // manual reset to lower offset detected
-            log.warn("Bootstrap polled offset has been reset to an earlier offset ({}) - truncating state - all records above including this will be replayed. Was expecting {} but bootstrap poll was {}.",
+            log.warn("Bootstrap polled offset has been reset to an earlier offset ({}) - truncating state - all records " +
+                            "above (including this) will be replayed. Was expecting {} but bootstrap poll was {}.",
                     polledOffset,
                     expectedBootstrapRecordOffset,
                     polledOffset
             );
-            // reset state to the polled offset
-            // todo option to save incompletes data and only replay offsets between polled through to expected? (just replay the offsets of which we've moved backwards by)
-            initState(new OffsetMapCodecManager.HighestOffsetAndIncompletes(Optional.of(polledOffset - 1), UniSets.of()));
-//            this.incompleteOffsets = new ConcurrentSkipListSet<>();
-//            this.commitQueue = new ConcurrentSkipListMap<>();
-        }
-
-        this.nextExpectedPolledOffset = polledOffset + 1;
-    }
 
-    // todo delete
-    private long nextExpectedPolledOffset = KAFKA_OFFSET_ABSENCE;
-
-    private long getNextExpectedPolledOffset() {
-        return nextExpectedPolledOffset;
+            // reset
+            var resetHighestSeenOffset = Optional.<Long>empty();
+            var resetIncompletesMap = UniSets.<Long>of();
+            var offsetData = new OffsetMapCodecManager.HighestOffsetAndIncompletes(resetHighestSeenOffset, resetIncompletesMap);
+            initStateFromOffsetData(offsetData);
+        }
     }
 
     /**
@@ -322,15 +308,18 @@ public boolean isRemoved() {
     }
 
     public Optional<OffsetAndMetadata> getCommitDataIfDirty() {
-        if (isDirty()) return of(createOffsetAndMetadata());
-        else return empty();
+        return isDirty() ?
+                of(createOffsetAndMetadata()) :
+                empty();
     }
 
     // visible for testing
     protected OffsetAndMetadata createOffsetAndMetadata() {
         Optional<String> payloadOpt = tryToEncodeOffsets();
         long nextOffset = getNextExpectedInitialPolledOffset();
-        return payloadOpt.map(s -> new OffsetAndMetadata(nextOffset, s)).orElseGet(() -> new OffsetAndMetadata(nextOffset));
+        return payloadOpt
+                .map(encodedOffsets -> new OffsetAndMetadata(nextOffset, encodedOffsets))
+                .orElseGet(() -> new OffsetAndMetadata(nextOffset));
     }
 
     /**
@@ -360,8 +349,8 @@ public Set<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         long highestSucceeded = getOffsetHighestSucceeded();
         //noinspection FuseStreamOperations Collectors.toUnmodifiableSet since v10
         return Collections.unmodifiableSet(incompleteOffsets.parallelStream()
-                // todo less than or less than and equal?
-                .filter(x -> x < highestSucceeded).collect(Collectors.toSet()));
+                .filter(x -> x < highestSucceeded)
+                .collect(Collectors.toSet()));
     }
 
     /**
@@ -433,11 +422,14 @@ private boolean updateBlockFromEncodingResult(String offsetMapPayload) {
             // exceeded maximum API allowed, strip the payload
             mustStrip = true;
             setAllowedMoreRecords(false);
-            log.warn("Offset map data too large (size: {}) to fit in metadata payload hard limit of {} - cannot include in commit. " + "Warning: messages might be replayed on rebalance. " + "See kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize = {} and issue #47.", metaPayloadLength, DefaultMaxMetadataSize, DefaultMaxMetadataSize);
+            log.warn("Offset map data too large (size: {}) to fit in metadata payload hard limit of {} - cannot include in commit. " +
+                    "Warning: messages might be replayed on rebalance. " +
+                    "See kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize = {} and issue #47.", metaPayloadLength, DefaultMaxMetadataSize, DefaultMaxMetadataSize);
         } else if (metaPayloadLength > getPressureThresholdValue()) { // and thus metaPayloadLength <= DefaultMaxMetadataSize
             // try to turn on back pressure before max size is reached
             setAllowedMoreRecords(false);
-            log.warn("Payload size {} higher than threshold {}, but still lower than max {}. Will write payload, but will " + "not allow further messages, in order to allow the offset data to shrink (via succeeding messages).", metaPayloadLength, getPressureThresholdValue(), DefaultMaxMetadataSize);
+            log.warn("Payload size {} higher than threshold {}, but still lower than max {}. Will write payload, but will " +
+                    "not allow further messages, in order to allow the offset data to shrink (via succeeding messages).", metaPayloadLength, getPressureThresholdValue(), DefaultMaxMetadataSize);
 
         } else { // and thus (metaPayloadLength <= pressureThresholdValue)
             setAllowedMoreRecords(true);
@@ -469,9 +461,12 @@ public boolean isBlocked() {
      * Each time we poll a patch of records, check to see that as expected our tracked incomplete offsets exist in the
      * set, otherwise they must have been removed from the underlying partition and should be removed from our tracking
      * as we'll ever be given the record again to retry.
+     * <p>
+     * <p>
+     * Also, does {@link #maybeTruncateBelowOrAbove}.
      */
     @SuppressWarnings("OptionalGetWithoutIsPresent") // checked with isEmpty
-    protected void pruneRemovedTrackedIncompleteOffsets(EpochAndRecordsMap<?, ?>.RecordsAndEpoch polledRecordBatch) {
+    protected void maybeTruncateOrPruneTrackedOffsets(EpochAndRecordsMap<?, ?>.RecordsAndEpoch polledRecordBatch) {
         var records = polledRecordBatch.getRecords();
 
         if (records.isEmpty()) {
@@ -491,22 +486,24 @@ protected void pruneRemovedTrackedIncompleteOffsets(EpochAndRecordsMap<?, ?>.Rec
         var high = getLast(records).get().offset(); // NOSONAR see #isEmpty
 
         // for the incomplete offsets within this range of poll batch
-        var subsetFromBatchRange = incompleteOffsets.subSet(low, true, high, true);
+        var incompletesWithinPolledBatch = incompleteOffsets.subSet(low, true, high, true);
 
-        for (long offset : subsetFromBatchRange) {
-            boolean offsetMissingFromPolledRecords = !polledOffsetLookup.contains(offset);
+        for (long incompleteOffset : incompletesWithinPolledBatch) {
+            boolean offsetMissingFromPolledRecords = !polledOffsetLookup.contains(incompleteOffset);
             if (offsetMissingFromPolledRecords) {
-                log.warn("Offset {} has been removed from partition {} (as it has not been returned within a polled batch which should have contained it - batch offset range is {} to {}), so it must be removed from tracking state, as it will never be sent again to be retried. This can be caused by PC rebalancing across a partition which has been compacted on offsets above the committed base offset, after initial load and before a rebalance.",
-                        offset,
+                log.warn("Offset {} has been removed from partition {} (as it has not been returned within a polled batch " +
+                                "which should have contained it - batch offset range is {} to {}), so it must be removed " +
+                                "from tracking state, as it will never be sent again to be retried. " +
+                                "This can be caused by PC rebalancing across a partition which has been compacted on offsets above the committed " +
+                                "base offset, after initial load and before a rebalance.",
+                        incompleteOffset,
                         getTp(),
                         low,
                         high
                 );
-                boolean removed1 = incompleteOffsets.remove(offset);
-                assert removed1;
-                // can't remove it from a collection wit would have never been added to
-//                boolean removed2 = commitQueue.remove(offset) != null;
-//                assert removed2;
+                boolean removedCheck = incompleteOffsets.remove(incompleteOffset);
+                assert removedCheck;
+                // don't need to remove it from the #commitQueue, as it would never have been added
             }
         }
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index e9e180600..8a654c1f9 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -341,7 +341,7 @@ void maybeRegisterNewRecordAsWork(final EpochAndRecordsMap<K, V> recordsMap) {
             var polledRecordBatch = recordsMap.records(partition);
 
             var partitionState = getPartitionState(polledRecordBatch);
-            partitionState.pruneRemovedTrackedIncompleteOffsets(polledRecordBatch);
+            partitionState.maybeTruncateOrPruneTrackedOffsets(polledRecordBatch);
 
             long epochOfInboundRecords = polledRecordBatch.getEpochOfPartitionAtPoll();
             for (var rec : polledRecordBatch.getRecords()) {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index 6d5045188..b049516f8 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -25,7 +25,7 @@
 /**
  * @author Antony Stubbs
  * @see PartitionState#maybeTruncateBelow
- * @see PartitionState#pruneRemovedTrackedIncompleteOffsets
+ * @see PartitionState#maybeTruncateOrPruneTrackedOffsets
  */
 class PartitionStateCommittedOffsetTest {
 
@@ -111,7 +111,7 @@ void committedOffsetLower() {
 
     private void addPollToState(PartitionState<String, String> state, PolledTestBatch polledTestBatch) {
         // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
-        state.pruneRemovedTrackedIncompleteOffsets(polledTestBatch.polledRecordBatch.records(tp));
+        state.maybeTruncateOrPruneTrackedOffsets(polledTestBatch.polledRecordBatch.records(tp));
         for (var wc : polledTestBatch.polledBatchWCs) {
             // todo when PSM and PartitionState are refactored, this conditional should not be needed
             var offset = wc.offset();

From 05e5ddb46493d83e361dbde45a23aa40496167c0 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 12:39:26 +0100
Subject: [PATCH 095/131] changelog

---
 CHANGELOG.adoc | 6 ++++++
 README.adoc    | 6 ++++++
 2 files changed, 12 insertions(+)

diff --git a/CHANGELOG.adoc b/CHANGELOG.adoc
index c3d166713..5243de648 100644
--- a/CHANGELOG.adoc
+++ b/CHANGELOG.adoc
@@ -14,6 +14,12 @@ ifndef::github_name[]
 toc::[]
 endif::[]
 
+== 0.5.2.4
+
+=== Fixes
+
+* fixes #409: Truncate state when bootstrap polled offset higher or lower than committed and prune missing records (#425)
+
 == 0.5.2.3
 
 === Improvements
diff --git a/README.adoc b/README.adoc
index e54bb742a..7548ccb35 100644
--- a/README.adoc
+++ b/README.adoc
@@ -1287,6 +1287,12 @@ ifndef::github_name[]
 toc::[]
 endif::[]
 
+== 0.5.2.4
+
+=== Fixes
+
+* fixes #409: Truncate state when bootstrap polled offset higher or lower than committed and prune missing records (#425)
+
 == 0.5.2.3
 
 === Improvements

From 747b132dd9b2bf7bcd961b435f53112d5140093e Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 13:02:22 +0100
Subject: [PATCH 096/131] review

---
 .../io/confluent/parallelconsumer/state/PolledTestBatch.java  | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
index 2749a4a1f..1b5d4bf39 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
@@ -1,5 +1,9 @@
 package io.confluent.parallelconsumer.state;
 
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
 import io.confluent.csid.utils.JavaUtils;
 import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import one.util.streamex.LongStreamEx;

From ea9b51a37345de0ec28028e1b28dda2f5eee1007 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 13:03:14 +0100
Subject: [PATCH 097/131] START: Improve offset encoding data structures

---
 .../offsets/BitSetEncoder.java                | 23 ++++++-----
 .../offsets/ByteBufferEncoder.java            |  2 +-
 .../offsets/OffsetEncoder.java                |  2 +-
 .../offsets/OffsetSimultaneousEncoder.java    | 38 ++++++++++++-------
 .../WorkManagerOffsetMapCodecManagerTest.java |  4 +-
 5 files changed, 42 insertions(+), 27 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index 64e607de1..cac6d56c4 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -45,12 +45,15 @@ public class BitSetEncoder extends OffsetEncoder {
 
     private static final Version DEFAULT_VERSION = Version.v2;
 
+    /**
+     * {@link BitSet} only supports {@link Integer#MAX_VALUE) bits
+     */
     public static final Integer MAX_LENGTH_ENCODABLE = Integer.MAX_VALUE;
 
     @Getter
-    private final BitSet bitSet;
+    private BitSet bitSet;
 
-    private final int originalLength;
+    private final long originalLength;
 
     private Optional<byte[]> encodedBytes = Optional.empty();
 
@@ -61,17 +64,15 @@ public BitSetEncoder(int length, OffsetSimultaneousEncoder offsetSimultaneousEnc
     /**
      * @param length the difference between the highest and lowest offset to be encoded
      */
-    public BitSetEncoder(int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) throws BitSetEncodingNotSupportedException {
+    public BitSetEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) throws BitSetEncodingNotSupportedException {
         super(offsetSimultaneousEncoder);
 
         this.version = newVersion;
 
-        bitSet = new BitSet(length);
-
         this.originalLength = length;
     }
 
-    private ByteBuffer constructWrappedByteBuffer(final int length, final Version newVersion) throws BitSetEncodingNotSupportedException {
+    private ByteBuffer constructWrappedByteBuffer(long length, Version newVersion) throws BitSetEncodingNotSupportedException {
         return switch (newVersion) {
             case v1 -> initV1(length);
             case v2 -> initV2(length);
@@ -84,20 +85,22 @@ private ByteBuffer constructWrappedByteBuffer(final int length, final Version ne
      * Integer.MAX_VALUE should always be good enough as system restricts large from being processed at once.
      */
     // TODO refactor inivtV2 and V1 together, passing in the Short or Integer
-    private ByteBuffer initV2(int bitsetEntriesRequired) throws BitSetEncodingNotSupportedException {
+    private ByteBuffer initV2(long bitsetEntriesRequired) throws BitSetEncodingNotSupportedException {
         if (bitsetEntriesRequired > MAX_LENGTH_ENCODABLE) {
             // need to upgrade to using Integer for the bitset length, but can't change serialisation format in-place
             throw new BitSetEncodingNotSupportedException(StringUtils.msg("BitSet V2 too long to encode, as length overflows Integer.MAX_VALUE. Length: {}. (max: {})", bitsetEntriesRequired, MAX_LENGTH_ENCODABLE));
         }
 
         // prep bit set buffer
+        bitSet = new BitSet((int) bitsetEntriesRequired);
+
         int bytesRequiredForEntries = (int) (Math.ceil((double) bitsetEntriesRequired / Byte.SIZE));
         int lengthEntryWidth = Integer.BYTES;
         int wrappedBufferLength = lengthEntryWidth + bytesRequiredForEntries + 1;
         final ByteBuffer wrappedBitSetBytesBuffer = ByteBuffer.allocate(wrappedBufferLength);
 
         // bitset doesn't serialise it's set capacity, so we have to as the unused capacity actually means something
-        wrappedBitSetBytesBuffer.putInt(bitsetEntriesRequired);
+        wrappedBitSetBytesBuffer.putInt((int) bitsetEntriesRequired);
 
         return wrappedBitSetBytesBuffer;
     }
@@ -107,13 +110,15 @@ private ByteBuffer initV2(int bitsetEntriesRequired) throws BitSetEncodingNotSup
      *
      * @return
      */
-    private ByteBuffer initV1(int bitsetEntriesRequired) throws BitSetEncodingNotSupportedException {
+    private ByteBuffer initV1(long bitsetEntriesRequired) throws BitSetEncodingNotSupportedException {
         if (bitsetEntriesRequired > Short.MAX_VALUE) {
             // need to upgrade to using Integer for the bitset length, but can't change serialisation format in-place
             throw new BitSetEncodingNotSupportedException("Input too long to encode for BitSet V1, length overflows Short.MAX_VALUE: " + bitsetEntriesRequired + ". (max: " + Short.MAX_VALUE + ")");
         }
 
         // prep bit set buffer
+        bitSet = new BitSet((int) bitsetEntriesRequired);
+
         int bytesRequiredForEntries = (int) (Math.ceil((double) bitsetEntriesRequired / Byte.SIZE));
         int lengthEntryWidth = Short.BYTES;
         int wrappedBufferLength = lengthEntryWidth + bytesRequiredForEntries + 1;
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
index 7459443b0..10bb2253b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
@@ -13,7 +13,7 @@ public class ByteBufferEncoder extends OffsetEncoder {
 
     private final ByteBuffer bytesBuffer;
 
-    public ByteBufferEncoder(final int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
+    public ByteBufferEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
         super(offsetSimultaneousEncoder);
         this.bytesBuffer = ByteBuffer.allocate(1 + length);
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
index 76f6ba7ef..e40a7503a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
@@ -35,7 +35,7 @@ protected OffsetEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
     abstract int getEncodedSize();
 
     boolean quiteSmall() {
-        return this.getEncodedSize() < OffsetSimultaneousEncoder.LARGE_INPUT_MAP_SIZE_THRESHOLD;
+        return this.getEncodedSize() < OffsetSimultaneousEncoder.LARGE_ENCODED_SIZE_THRESHOLD_BYTES;
     }
 
     byte[] compress() throws IOException {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index 82e4ab738..ba005d0a9 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -32,7 +32,12 @@ public class OffsetSimultaneousEncoder {
      * Size threshold in bytes after which compressing the encodings will be compared, as it seems to be typically worth
      * the extra compression step when beyond this size in the source array.
      */
-    public static final int LARGE_INPUT_MAP_SIZE_THRESHOLD = 200;
+    public static final int LARGE_ENCODED_SIZE_THRESHOLD_BYTES = 200;
+
+    /**
+     * Size threshold to notice particularly large input maps.
+     */
+    public static final int LARGE_INPUT_MAP_SIZE = 2_000;
 
     /**
      * The offsets which have not yet been fully completed and can't have their offset committed
@@ -47,10 +52,8 @@ public class OffsetSimultaneousEncoder {
 
     /**
      * The difference between the base offset (the offset to be committed) and the highest seen offset.
-     * <p>
-     * {@link BitSet} only supports {@link Integer#MAX_VALUE) bits
      */
-    private final int length;
+    private final long lengthBetweenBaseAndHighOffset;
 
     /**
      * Map of different encoding types for the same offset data, used for retrieving the data for the encoding type
@@ -102,9 +105,9 @@ public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededO
         }
 
         // BitSet only support Integer.MAX_VALUE bits
-        length = (int) bitsetLengthL;
+        lengthBetweenBaseAndHighOffset = (int) bitsetLengthL;
         // sanity
-        if (bitsetLengthL != length) throw new IllegalArgumentException("Integer overflow");
+        if (bitsetLengthL != lengthBetweenBaseAndHighOffset) throw new IllegalArgumentException("Integer overflow");
 
         this.encoders = initEncoders();
     }
@@ -140,18 +143,18 @@ private long maybeRaiseOffsetHighestSucceeded(long baseOffsetToCommit, long high
 
     private Set<OffsetEncoder> initEncoders() {
         var newEncoders = new HashSet<OffsetEncoder>();
-        if (length > LARGE_INPUT_MAP_SIZE_THRESHOLD) {
-            log.debug("~Large input map size: {} (start: {} end: {})", length, lowWaterMark, lowWaterMark + length);
+        if (lengthBetweenBaseAndHighOffset > LARGE_INPUT_MAP_SIZE) {
+            log.trace("Relatively large input map size: {} (start: {} end: {})", lengthBetweenBaseAndHighOffset, lowWaterMark, getEndOffsetExclusive());
         }
 
         try {
-            newEncoders.add(new BitSetEncoder(length, this, v1));
+            newEncoders.add(new BitSetEncoder(lengthBetweenBaseAndHighOffset, this, v1));
         } catch (BitSetEncodingNotSupportedException a) {
             log.debug("Cannot use {} encoder ({})", BitSetEncoder.class.getSimpleName(), a.getMessage());
         }
 
         try {
-            newEncoders.add(new BitSetEncoder(length, this, v2));
+            newEncoders.add(new BitSetEncoder(lengthBetweenBaseAndHighOffset, this, v2));
         } catch (BitSetEncodingNotSupportedException a) {
             log.warn("Cannot use {} encoder ({})", BitSetEncoder.class.getSimpleName(), a.getMessage());
         }
@@ -162,13 +165,20 @@ private Set<OffsetEncoder> initEncoders() {
         return newEncoders;
     }
 
+    /**
+     * The end offset (exclusive)
+     */
+    private long getEndOffsetExclusive() {
+        return lowWaterMark + lengthBetweenBaseAndHighOffset;
+    }
+
     /**
      * Not enabled as byte buffer seems to always be beaten by BitSet, which makes sense
      * <p>
      * Visible for testing
      */
     void addByteBufferEncoder() {
-        encoders.add(new ByteBufferEncoder(length, this));
+        encoders.add(new ByteBufferEncoder(lengthBetweenBaseAndHighOffset, this));
     }
 
     /**
@@ -197,18 +207,18 @@ void addByteBufferEncoder() {
      *  TODO VERY large offests ranges are slow (Integer.MAX_VALUE) - encoding scans could be avoided if passing in map of incompletes which should already be known
      */
     public OffsetSimultaneousEncoder invoke() {
-        log.debug("Starting encode of incompletes, base offset is: {}, end offset is: {}", lowWaterMark, lowWaterMark + length);
+        log.debug("Starting encode of incompletes, base offset is: {}, end offset is: {}", lowWaterMark, getEndOffsetExclusive());
         log.trace("Incompletes are: {}", this.incompleteOffsets);
 
         //
-        log.debug("Encode loop offset start,end: [{},{}] length: {}", this.lowWaterMark, lowWaterMark + length, length);
+        log.debug("Encode loop offset start,end: [{},{}] length: {}", this.lowWaterMark, getEndOffsetExclusive(), lengthBetweenBaseAndHighOffset);
         /*
          * todo refactor this loop into the encoders (or sequential vs non sequential encoders) as RunLength doesn't need
          *  to look at every offset in the range, only the ones that change from 0 to 1. BitSet however needs to iterate
          *  the entire range. So when BitSet can't be used, the encoding would be potentially a lot faster as RunLength
          *  didn't need the whole loop.
          */
-        range(length).forEach(rangeIndex -> {
+        range(lengthBetweenBaseAndHighOffset).forEach(rangeIndex -> {
             final long offset = this.lowWaterMark + rangeIndex;
             List<OffsetEncoder> removeToBeRemoved = new ArrayList<>();
             if (this.incompleteOffsets.contains(offset)) {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
index 5469c6335..2269b3590 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
@@ -322,9 +322,9 @@ void compressDecompressSanityZstd() {
     @Test
     void largeOffsetMap() {
         injectSucceededWorkAtOffset(200); // force system to have seen a high offset
-        byte[] bytes = offsetCodecManager.encodeOffsetsCompressed(0L, state);
+        byte[] encoded = offsetCodecManager.encodeOffsetsCompressed(0L, state);
         int smallestCompressionObserved = 10;
-        assertThat(bytes).as("very small")
+        assertThat(encoded).as("very small")
                 .hasSizeLessThan(smallestCompressionObserved); // arbitrary size expectation based on past observations - expect around 7
     }
 

From a8e28c30b70c70c2872d785486ceb83f6c98b4ec Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 13:35:17 +0100
Subject: [PATCH 098/131] fix OffsetEncodingTests

---
 .../PartitionStateCommittedOffsetIT.java      |  5 ++
 .../offsets/OffsetEncodingTests.java          | 61 +++++++++++++------
 .../PartitionStateCommittedOffsetTest.java    |  5 ++
 .../src/test/resources/logback-test.xml       |  5 +-
 4 files changed, 55 insertions(+), 21 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index 9871a4118..cc044bf09 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -8,6 +8,11 @@
 import org.apache.kafka.clients.admin.AdminClient;
 import org.apache.kafka.common.TopicPartition;
 
+/**
+ * todo docs
+ *
+ * @author Antony Stubbs
+ */
 class PartitionStateCommittedOffsetIT extends BrokerIntegrationTest<String, String> {
 
     AdminClient ac;
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
index 6cbed585e..43295b819 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
@@ -23,6 +23,7 @@
 import org.junit.jupiter.params.provider.EnumSource;
 import org.junit.jupiter.params.provider.ValueSource;
 import pl.tlinkowski.unij.api.UniLists;
+import pl.tlinkowski.unij.api.UniMaps;
 import pl.tlinkowski.unij.api.UniSets;
 
 import java.nio.ByteBuffer;
@@ -31,7 +32,6 @@
 
 import static io.confluent.parallelconsumer.ManagedTruth.assertTruth;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.*;
-import static io.confluent.parallelconsumer.state.PartitionState.KAFKA_OFFSET_ABSENCE;
 import static org.assertj.core.api.Assertions.assertThat;
 import static org.hamcrest.Matchers.in;
 import static org.hamcrest.Matchers.not;
@@ -116,6 +116,8 @@ void largeIncompleteOffsetValues(long nextExpectedOffset) {
     }
 
     /**
+     * Test for offset encoding when there is a very large range of offsets, and where the offsets aren't sequential.
+     * <p>
      * There's no guarantee that offsets are always sequential. The most obvious case is with a compacted topic - there
      * will always be offsets missing.
      *
@@ -138,7 +140,8 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         OffsetSimultaneousEncoder.compressionForced = true;
 
         var records = new ArrayList<ConsumerRecord<String, String>>();
-        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 0, "akey", "avalue")); // will complete
+        final int FIRST_SUCCEEDED_OFFSET = 0;
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, FIRST_SUCCEEDED_OFFSET, "akey", "avalue")); // will complete
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 1, "akey", "avalue"));
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 4, "akey", "avalue"));
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 5, "akey", "avalue"));
@@ -153,15 +156,15 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 40_000, "akey", "avalue")); // higher than Short.MAX_VALUE
         int avoidOffByOne = 2;
         records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, 40_000 + Short.MAX_VALUE + avoidOffByOne, "akey", "avalue")); // runlength higher than Short.MAX_VALUE
-        int highest = 40_000 + Short.MAX_VALUE + avoidOffByOne + 1;
-        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, highest, "akey", "avalue")); // will complete to force whole encoding
+        int highestSucceeded = 40_000 + Short.MAX_VALUE + avoidOffByOne + 1;
+        records.add(new ConsumerRecord<>(INPUT_TOPIC, 0, highestSucceeded, "akey", "avalue")); // will complete to force whole encoding
 
 
         var incompleteRecords = new ArrayList<>(records);
-        incompleteRecords.remove(incompleteRecords.stream().filter(x -> x.offset() == 0).findFirst().get());
+        incompleteRecords.remove(incompleteRecords.stream().filter(x -> x.offset() == FIRST_SUCCEEDED_OFFSET).findFirst().get());
         incompleteRecords.remove(incompleteRecords.stream().filter(x -> x.offset() == 69).findFirst().get());
         incompleteRecords.remove(incompleteRecords.stream().filter(x -> x.offset() == 25_000).findFirst().get());
-        incompleteRecords.remove(incompleteRecords.stream().filter(x -> x.offset() == highest).findFirst().get());
+        incompleteRecords.remove(incompleteRecords.stream().filter(x -> x.offset() == highestSucceeded).findFirst().get());
 
         List<Long> expected = incompleteRecords.stream().map(ConsumerRecord::offset)
                 .sorted()
@@ -179,6 +182,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
         // write offsets
         final ParallelConsumerOptions<String, String> newOptions = options.toBuilder().consumer(consumerSpy).build();
+        final long FIRST_COMMITTED_OFFSET = 1L;
         {
             WorkManager<String, String> wmm = new WorkManager<>(new PCModule<>(newOptions));
             wmm.onPartitionsAssigned(UniSets.of(new TopicPartition(INPUT_TOPIC, 0)));
@@ -187,18 +191,18 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
             List<WorkContainer<String, String>> work = wmm.getWorkIfAvailable();
             assertThat(work).hasSameSizeAs(records);
 
-            KafkaTestUtils.completeWork(wmm, work, 0);
+            KafkaTestUtils.completeWork(wmm, work, FIRST_SUCCEEDED_OFFSET);
 
             KafkaTestUtils.completeWork(wmm, work, 69);
 
             KafkaTestUtils.completeWork(wmm, work, 25_000);
 
-            KafkaTestUtils.completeWork(wmm, work, highest);
+            KafkaTestUtils.completeWork(wmm, work, highestSucceeded);
 
 
             // make the commit
             var completedEligibleOffsets = wmm.collectCommitDataForDirtyPartitions();
-            assertThat(completedEligibleOffsets.get(tp).offset()).isEqualTo(1L);
+            assertThat(completedEligibleOffsets.get(tp).offset()).isEqualTo(FIRST_COMMITTED_OFFSET);
             consumerSpy.commitSync(completedEligibleOffsets);
 
             {
@@ -206,7 +210,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
                 OffsetMapCodecManager<String, String> om = new OffsetMapCodecManager<>(consumerSpy);
                 OffsetMapCodecManager.forcedCodec = Optional.empty(); // turn off forced
                 var state = wmm.getPm().getPartitionState(tp);
-                String bestPayload = om.makeOffsetMetadataPayload(1, state);
+                String bestPayload = om.makeOffsetMetadataPayload(FIRST_COMMITTED_OFFSET, state);
                 assertThat(bestPayload).isNotEmpty();
             }
         }
@@ -214,7 +218,7 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         // check
         {
             var committed = consumerSpy.committed(UniSets.of(tp)).get(tp);
-            assertThat(committed.offset()).isEqualTo(1L);
+            assertThat(committed.offset()).isEqualTo(FIRST_COMMITTED_OFFSET);
 
             if (assumeWorkingCodec(encoding, encodingsThatFail)) {
                 assertThat(committed.metadata()).isNotBlank();
@@ -227,22 +231,43 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         {
             var newWm = new WorkManager<>(new PCModule<>(options));
             newWm.onPartitionsAssigned(UniSets.of(tp));
-            newWm.registerWork(new EpochAndRecordsMap<>(testRecords, newWm.getPm()));
 
+            //
             var pm = newWm.getPm();
             var partitionState = pm.getPartitionState(tp);
 
             if (assumeWorkingCodec(encoding, encodingsThatFail)) {
+                // check state reloaded ok from consumer
+                assertTruth(partitionState).getOffsetHighestSucceeded().isEqualTo(highestSucceeded);
+            }
+
+            //
+            ConsumerRecords<String, String> testRecordsWithBaseCommittedRecordRemoved = new ConsumerRecords<>(UniMaps.of(tp,
+                    testRecords.records(tp)
+                            .stream()
+                            .filter(x ->
+                                    x.offset() >= FIRST_COMMITTED_OFFSET)
+                            .collect(Collectors.toList())));
+            EpochAndRecordsMap<String, String> epochAndRecordsMap = new EpochAndRecordsMap<>(testRecordsWithBaseCommittedRecordRemoved, newWm.getPm());
+            newWm.registerWork(epochAndRecordsMap);
+
+            if (assumeWorkingCodec(encoding, encodingsThatFail)) {
+                // check state reloaded ok from consumer
+                assertTruth(partitionState).getOffsetHighestSucceeded().isEqualTo(highestSucceeded);
+            }
+
+            //
+            if (assumeWorkingCodec(encoding, encodingsThatFail)) {
 //                long offsetHighestSequentialSucceeded = partitionState.getOffsetHighestSequentialSucceeded();
 //                assertThat(offsetHighestSequentialSucceeded).isEqualTo(0);
-                assertTruth(partitionState).getOffsetHighestSequentialSucceeded().isEqualTo(KAFKA_OFFSET_ABSENCE);
+                assertTruth(partitionState).getOffsetHighestSequentialSucceeded().isEqualTo(FIRST_SUCCEEDED_OFFSET);
 
 //                long offsetHighestSucceeded = partitionState.getOffsetHighestSucceeded();
-//                assertThat(offsetHighestSucceeded).isEqualTo(highest);
-                assertTruth(partitionState).getOffsetHighestSucceeded().isEqualTo(highest);
+//                assertThat(offsetHighestSucceeded).isEqualTo(highestSucceeded);
+                assertTruth(partitionState).getOffsetHighestSucceeded().isEqualTo(highestSucceeded);
 
                 long offsetHighestSeen = partitionState.getOffsetHighestSeen();
-                assertThat(offsetHighestSeen).isEqualTo(highest);
+                assertThat(offsetHighestSeen).isEqualTo(highestSucceeded);
 
                 var incompletes = partitionState.getIncompleteOffsetsBelowHighestSucceeded();
                 Truth.assertThat(incompletes).containsExactlyElementsIn(expected);
@@ -259,10 +284,10 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
                     assertThat(offsetHighestSequentialSucceeded).isEqualTo(0);
 
                     long offsetHighestSucceeded = partitionState.getOffsetHighestSucceeded();
-                    assertThat(offsetHighestSucceeded).isEqualTo(highest);
+                    assertThat(offsetHighestSucceeded).isEqualTo(highestSucceeded);
 
                     long offsetHighestSeen = partitionState.getOffsetHighestSeen();
-                    assertThat(offsetHighestSeen).isEqualTo(highest);
+                    assertThat(offsetHighestSeen).isEqualTo(highestSucceeded);
 
                     var incompletes = partitionState.getIncompleteOffsetsBelowHighestSucceeded();
                     Truth.assertThat(incompletes).containsExactlyElementsIn(expected);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index b049516f8..b71c2bd38 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -5,6 +5,7 @@
  */
 
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
+import io.confluent.parallelconsumer.offsets.OffsetEncodingTests;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
 import one.util.streamex.LongStreamEx;
 import org.apache.kafka.clients.admin.AdminClient;
@@ -23,7 +24,10 @@
 import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
 
 /**
+ * todo docs
+ *
  * @author Antony Stubbs
+ * @see OffsetEncodingTests#ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential
  * @see PartitionState#maybeTruncateBelow
  * @see PartitionState#maybeTruncateOrPruneTrackedOffsets
  */
@@ -152,6 +156,7 @@ private void addPollToState(PartitionState<String, String> state, PolledTestBatc
      *
      * @implSpec issue #409: Committing old offset after OFFSET_OUT_OF_RANGE
      * @see PartitionState#maybeTruncateBelow
+     * @see OffsetEncodingTests#ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential
      */
     @Test
     void bootstrapPollOffsetHigherDueToRetentionOrCompaction() {
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 87c99a321..0a9472e95 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -27,8 +27,8 @@
     </root>
 
     <!-- primary -->
-    <!--    <logger name="io.confluent.parallelconsumer" level="info"/>-->
-    <!-- <logger name="io.confluent.parallelconsumer" level="debug"/> -->
+    <logger name="io.confluent.parallelconsumer" level="info"/>
+    <!--    <logger name="io.confluent.parallelconsumer" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer" level="trace"/>-->
 
     <!-- <logger name="io.confluent.csid" level="debug"/> -->
@@ -79,7 +79,6 @@
     <!--    <logger name="io.confluent.parallelconsumer" level="error"/>-->
 
 
-
     <!--            <logger name="io.confluent.parallelconsumer" level="trace" />-->
 
     <!-- notable specifics -->

From 6b93b1f988aa01f74a864868ce598e6b57595f0c Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 18:51:24 +0100
Subject: [PATCH 099/131] Draft PartitionStateCommittedOffsetIT, partially
 passing

---
 .../io/confluent/csid/utils/JavaUtils.java    |  21 +-
 .../state/PartitionState.java                 |  12 +-
 .../BrokerIntegrationTest.java                |   9 +-
 .../PartitionStateCommittedOffsetIT.java      | 302 +++++++++++++++++-
 .../utils/KafkaClientUtils.java               |  12 +-
 .../io/confluent/csid/utils/ThreadUtils.java  |   4 +
 .../offsets/OffsetEncodingTests.java          |   4 -
 .../PartitionStateCommittedOffsetTest.java    |  22 +-
 .../state/PolledTestBatch.java                |   8 +-
 9 files changed, 345 insertions(+), 49 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
index 00507cba7..647175d8b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/JavaUtils.java
@@ -8,12 +8,10 @@
 import lombok.experimental.UtilityClass;
 
 import java.time.Duration;
-import java.util.Collection;
-import java.util.List;
-import java.util.Map;
-import java.util.Optional;
+import java.util.*;
 import java.util.function.Function;
 import java.util.stream.Collectors;
+import java.util.stream.Stream;
 
 import static java.time.Duration.ofMillis;
 
@@ -60,4 +58,19 @@ public static <K, V1, V2> Map<K, V2> remap(Map<K, V1> map,
                 ));
     }
 
+    public static List<String> getRandom(List<String> list, int quantity) {
+        if (list.size() < quantity) {
+            throw new IllegalArgumentException("List size is less than quantity");
+        }
+
+        return createRandomIntStream(list.size())
+                .limit(quantity)
+                .map(list::get)
+                .collect(Collectors.toList());
+    }
+
+    private static Stream<Integer> createRandomIntStream(int range) {
+        final Random random = new Random();
+        return Stream.generate(() -> random.nextInt(range));
+    }
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 522cf955a..12ced89b1 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -30,7 +30,7 @@
 import static lombok.AccessLevel.*;
 
 /**
- * Our view of our state of the partitions that we've been assigned.
+ * Our view of the state of the partitions that we've been assigned.
  *
  * @see PartitionStateManager
  */
@@ -329,7 +329,7 @@ protected OffsetAndMetadata createOffsetAndMetadata() {
      */
     // visible for testing
     // todo change back to protected? and enable protected level managed truth (seems to be limited to public)
-    public long getNextExpectedInitialPolledOffset() {
+    protected long getNextExpectedInitialPolledOffset() {
         return getOffsetHighestSequentialSucceeded() + 1;
     }
 
@@ -423,13 +423,15 @@ private boolean updateBlockFromEncodingResult(String offsetMapPayload) {
             mustStrip = true;
             setAllowedMoreRecords(false);
             log.warn("Offset map data too large (size: {}) to fit in metadata payload hard limit of {} - cannot include in commit. " +
-                    "Warning: messages might be replayed on rebalance. " +
-                    "See kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize = {} and issue #47.", metaPayloadLength, DefaultMaxMetadataSize, DefaultMaxMetadataSize);
+                            "Warning: messages might be replayed on rebalance. " +
+                            "See kafka.coordinator.group.OffsetConfig#DefaultMaxMetadataSize = {} and issue #47.",
+                    metaPayloadLength, DefaultMaxMetadataSize, DefaultMaxMetadataSize);
         } else if (metaPayloadLength > getPressureThresholdValue()) { // and thus metaPayloadLength <= DefaultMaxMetadataSize
             // try to turn on back pressure before max size is reached
             setAllowedMoreRecords(false);
             log.warn("Payload size {} higher than threshold {}, but still lower than max {}. Will write payload, but will " +
-                    "not allow further messages, in order to allow the offset data to shrink (via succeeding messages).", metaPayloadLength, getPressureThresholdValue(), DefaultMaxMetadataSize);
+                            "not allow further messages, in order to allow the offset data to shrink (via succeeding messages).",
+                    metaPayloadLength, getPressureThresholdValue(), DefaultMaxMetadataSize);
 
         } else { // and thus (metaPayloadLength <= pressureThresholdValue)
             setAllowedMoreRecords(true);
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
index 7fea7ad30..d4402302f 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
@@ -10,6 +10,7 @@
 import io.confluent.csid.testcontainers.FilteredTestContainerSlf4jLogConsumer;
 import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils;
 import lombok.Getter;
+import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.CreateTopicsResult;
 import org.apache.kafka.clients.admin.NewTopic;
@@ -21,6 +22,7 @@
 import org.testcontainers.utility.DockerImageName;
 import pl.tlinkowski.unij.api.UniLists;
 
+import java.util.List;
 import java.util.concurrent.ExecutionException;
 
 import static org.apache.commons.lang3.RandomUtils.nextInt;
@@ -80,7 +82,7 @@ void close() {
         kcu.close();
     }
 
-    void setupTopic() {
+    protected void setupTopic() {
         String name = LoadTest.class.getSimpleName();
         setupTopic(name);
     }
@@ -108,4 +110,9 @@ protected CreateTopicsResult ensureTopic(String topic, int numPartitions) {
         return topics;
     }
 
+    @SneakyThrows
+    protected List<String> produceMessages(int quantity) {
+        return getKcu().produceMessages(getTopic(), quantity);
+    }
+
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index cc044bf09..67272e227 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -4,53 +4,343 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import com.google.common.truth.Truth;
+import io.confluent.csid.utils.JavaUtils;
+import io.confluent.csid.utils.ThreadUtils;
+import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
+import io.confluent.parallelconsumer.PollContext;
 import io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest;
+import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils.GroupOption;
+import lombok.SneakyThrows;
+import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.AdminClient;
+import org.apache.kafka.clients.admin.AlterConfigOp;
+import org.apache.kafka.clients.admin.ConfigEntry;
+import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import org.apache.kafka.clients.producer.ProducerRecord;
+import org.apache.kafka.clients.producer.RecordMetadata;
+import org.apache.kafka.common.KafkaFuture;
 import org.apache.kafka.common.TopicPartition;
+import org.apache.kafka.common.config.ConfigResource;
+import org.apache.kafka.common.config.TopicConfig;
+import org.junit.jupiter.api.BeforeEach;
+import org.junit.jupiter.api.Test;
+import org.testcontainers.shaded.org.awaitility.Awaitility;
+import pl.tlinkowski.unij.api.UniMaps;
+
+import java.util.*;
+import java.util.concurrent.ConcurrentLinkedQueue;
+import java.util.concurrent.Future;
+import java.util.concurrent.atomic.AtomicLong;
+import java.util.stream.Collectors;
+
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.PARTITION;
+import static java.util.concurrent.TimeUnit.SECONDS;
+import static org.testcontainers.shaded.org.hamcrest.Matchers.equalTo;
+import static pl.tlinkowski.unij.api.UniLists.of;
 
 /**
- * todo docs
+ * Integration test versions of {@link io.confluent.parallelconsumer.state.PartitionStateCommittedOffsetTest}, where
+ * committed offset gets moved around or deleted, or random offsets are removed.
  *
  * @author Antony Stubbs
+ * @see io.confluent.parallelconsumer.state.PartitionStateCommittedOffsetTest
  */
+@Slf4j
 class PartitionStateCommittedOffsetIT extends BrokerIntegrationTest<String, String> {
 
     AdminClient ac;
 
-    String groupId = getKcu().getConsumer().groupMetadata().groupId();
+    String groupId;
+
+    ParallelEoSStreamProcessor<String, String> pc;
+
+    TopicPartition tp;
+
+    final int TO_PRODUCE = 200;
 
-    TopicPartition tp = new TopicPartition("topic", 0);
+    @BeforeEach
+    void setup() {
+        setupTopic();
+        tp = new TopicPartition(getTopic(), 0);
+        groupId = getKcu().getConsumer().groupMetadata().groupId();
+        this.ac = getKcu().getAdmin();
+    }
 
     /**
      * Test for offset gaps in partition data (i.e. compacted topics)
      */
+    @Test
     void compactedTopic() {
+        setupCompacted();
+
+        List<String> keys = produceMessages(TO_PRODUCE);
+
+        final int UNTIL_OFFSET = 50;
+        var processedOnFirstRun = runPcUntilOffset(UNTIL_OFFSET);
+
+        closePC();
+
+        Set<String> tombStonedKeys = new HashSet<>(sendRandomTombstones(keys, UNTIL_OFFSET, TO_PRODUCE));
+
+        var processedOnFirstRunWithTombstoneTargetsRemoved = processedOnFirstRun.stream()
+                .filter(context -> !tombStonedKeys.contains(context.key()))
+                .map(PollContext::key)
+                .collect(Collectors.toList());
+
+        var firstRunPartitioned = processedOnFirstRun.stream().collect(Collectors.partitioningBy(context -> tombStonedKeys.contains(context.key())));
+        var saved = firstRunPartitioned.get(Boolean.FALSE);
+        var tombstoned = firstRunPartitioned.get(Boolean.TRUE);
+
+        var tombstoneTargetOffsetsFromFirstRun = tombstoned.stream()
+                .filter(context -> tombStonedKeys.contains(context.key()))
+                .map(PollContext::offset)
+                .collect(Collectors.toList());
+
+        var tombStonedOffsetsFromKey = tombStonedKeys.stream()
+                .map(PartitionStateCommittedOffsetIT::getOffsetFromKey).collect(Collectors.toList());
+        log.debug("First run produced, with tombstone targets removed: {}", processedOnFirstRunWithTombstoneTargetsRemoved);
+
+        triggerTombStoneProcessing();
+
+        // The offsets of the tombstone targets should not be read in second run
+        final int expectedTotalNumberRecordsProduced = TO_PRODUCE + tombStonedOffsetsFromKey.size();
+        final int expectedOffsetProcessedToSecondRun = TO_PRODUCE + tombStonedKeys.size();
+        var processedOnSecondRun = runPcUntilOffset(expectedOffsetProcessedToSecondRun);
+
+        final List<String> offsetsFromSecondRunFromKey = processedOnSecondRun.stream()
+                .map(PollContext::key)
+                .collect(Collectors.toList());
+
+        final List<Long> offsetsFromSecond = processedOnSecondRun.stream()
+                .map(PollContext::offset)
+                .collect(Collectors.toList());
+
+        Truth.assertWithMessage("The offsets of the tombstone targets should not be read in second run")
+                .that(offsetsFromSecond)
+                .containsNoneIn(tombstoneTargetOffsetsFromFirstRun);
+
+        final int expectedNumberOfRecordsProcessedSecondRun = TO_PRODUCE - tombStonedOffsetsFromKey.size();
+        Truth.assertWithMessage("Processed on second run should be original sent, minus number of tombstones sent")
+                .that(processedOnSecondRun)
+                .hasSize(expectedNumberOfRecordsProcessedSecondRun);
+    }
+
+    private static long getOffsetFromKey(String key) {
+        return Long.parseLong(key.substring(key.indexOf("-") + 1));
+    }
+
+    @SneakyThrows
+    private void setupCompacted() {
+        log.debug("Setting up aggressive compaction...");
+        ConfigResource topicConfig = new ConfigResource(ConfigResource.Type.TOPIC, getTopic());
+
+        Collection<AlterConfigOp> alterConfigOps = new ArrayList<>();
+
+        alterConfigOps.add(new AlterConfigOp(new ConfigEntry(TopicConfig.CLEANUP_POLICY_CONFIG, TopicConfig.CLEANUP_POLICY_COMPACT), AlterConfigOp.OpType.SET));
+        alterConfigOps.add(new AlterConfigOp(new ConfigEntry(TopicConfig.MAX_COMPACTION_LAG_MS_CONFIG, "1"), AlterConfigOp.OpType.SET));
+        alterConfigOps.add(new AlterConfigOp(new ConfigEntry(TopicConfig.MIN_CLEANABLE_DIRTY_RATIO_CONFIG, "0"), AlterConfigOp.OpType.SET));
+
+        var configs = UniMaps.of(topicConfig, alterConfigOps);
+        KafkaFuture<Void> all = ac.incrementalAlterConfigs(configs).all();
+        all.get(5, SECONDS);
+
+        log.debug("Compaction setup complete");
+    }
+
+    @SneakyThrows
+    private void triggerTombStoneProcessing() {
+        ThreadUtils.sleepSecondsLog(30);
+    }
+
+    @SneakyThrows
+    private ArrayList<String> sendRandomTombstones(List<String> keys, int from, int to) {
+        var tombstoneKeys = new ArrayList<String>();
+        var howMany = (to - from) / 3;
+        // fix randomness
+        List<Future<RecordMetadata>> futures = JavaUtils.getRandom(keys, howMany).stream()
+                .map((String key) -> {
+                    tombstoneKeys.add(key);
+                    var tombstone = new ProducerRecord<>(getTopic(), key, "tombstone");
+                    return getKcu().getProducer()
+                            .send(tombstone);
+                })
+                .collect(Collectors.toList());
+        List<Long> tombstoneOffsets = new ArrayList<>();
+        for (Future<RecordMetadata> future : futures) {
+            RecordMetadata recordMetadata = future.get(5, SECONDS);
+            tombstoneOffsets.add(recordMetadata.offset());
+        }
 
+        log.debug("Generated tombstones: {}", tombstoneOffsets);
+        return tombstoneKeys;
     }
 
     /**
      * CG offset has been changed to a lower offset (partition rewind / replay) (metdata lost?)
      */
+    @Test
     void committedOffsetLower() {
-//        ac.alterConsumerGroupOffsets(groupId, )
+        produceMessages(TO_PRODUCE);
+
+        runPcUntilOffset(50);
+
+        closePC();
+
+        final int moveToOffset = 25;
+
+        moveCommittedOffset(moveToOffset);
+
+        runPcCheckStartIs(moveToOffset, TO_PRODUCE);
+    }
+
+    /**
+     * Ensure that the PC starts at the correct offset
+     *
+     * @param targetStartOffset the offset to check that PC starts at
+     * @param checkUpTo         the offset to run the PC until, while checking for the start offset
+     */
+    private void runPcCheckStartIs(long targetStartOffset, long checkUpTo) {
+        this.pc = super.getKcu().buildPc(PARTITION);
+        pc.subscribe(of(getTopic()));
+
+        AtomicLong lowest = new AtomicLong(Long.MAX_VALUE);
+        AtomicLong highest = new AtomicLong();
+
+        pc.poll(recordContexts -> {
+            long thisOffset = recordContexts.offset();
+            if (thisOffset < lowest.get()) {
+                log.debug("Found lowest offset {}", thisOffset);
+                lowest.set(thisOffset);
+            } else {
+                highest.set(thisOffset);
+            }
+        });
+
+        Awaitility.await().untilAtomic(highest, equalTo(checkUpTo - 1));
+
+        pc.close();
+
+        Truth.assertWithMessage("Offset started as").that(lowest.get()).isEqualTo(targetStartOffset);
+    }
+
+    @SneakyThrows
+    private void moveCommittedOffset(long offset) {
+        log.debug("Moving offset to {}", offset);
+        var data = UniMaps.of(tp, new OffsetAndMetadata(offset));
+        var result = ac.alterConsumerGroupOffsets(groupId, data);
+        result.all().get(5, SECONDS);
+        log.debug("Moved offset to {}", offset);
+    }
+
+    private void closePC() {
+        pc.close();
+    }
+
+    private ArrayList<PollContext<String, String>> runPcUntilOffset(long targetOffset) {
+        this.pc = super.getKcu().buildPc(PARTITION, GroupOption.NEW_GROUP);
+
+        Queue<PollContext<String, String>> concurrentList = new ConcurrentLinkedQueue<>();
+        AtomicLong current = new AtomicLong();
+        pc.subscribe(of(getTopic()));
+        pc.poll(pollContext -> {
+            long thisOffset = pollContext.offset();
+            if (thisOffset >= targetOffset) {
+                log.debug("Failing on {}", thisOffset);
+            } else {
+                log.debug("Processed {}", thisOffset);
+                current.set(thisOffset);
+            }
+            concurrentList.add(pollContext);
+        });
+
+        Awaitility.await().untilAtomic(current, equalTo(targetOffset - 1));
+        log.debug("Consumed up to {}", targetOffset);
+
+        var sorted = new ArrayList<>(concurrentList);
+        Collections.sort(sorted, Comparator.comparingLong(PollContext::offset));
+        return sorted;
     }
 
     /**
      * CG offset has been changed to something higher than expected (offset skip) (metdata lost?)
      */
+    @Test
     void committedOffsetHigher() {
+        final int quantity = 100;
+        produceMessages(quantity);
+
+        runPcUntilOffset(50);
+
+        closePC();
+
+        final int moveToOffset = 75;
+
+        moveCommittedOffset(moveToOffset);
+
+        runPcCheckStartIs(moveToOffset, quantity);
     }
 
     /**
      * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
      * with a higher offset than expected. Could be caused by retention period, or compaction.
      */
+    @Test
     void committedOffsetRemoved() {
+        produceMessages(TO_PRODUCE);
+
+        final int END_OFFSET = 50;
+        runPcUntilOffset(END_OFFSET);
+
+        closePC();
+
+        causeCommittedOffsetToBeRemoved(END_OFFSET);
+
+        produceMessages(TO_PRODUCE);
+
+        final int TOTAL = TO_PRODUCE * 2;
+        runPcCheckStartIs(END_OFFSET + 1, TOTAL);
+    }
+
+    private void causeCommittedOffsetToBeRemoved(long offset) {
+        throw new RuntimeException();
+    }
+
+    @Test
+    void cgOffsetsDeletedResetLatest() {
+        produceMessages(TO_PRODUCE);
+
+        final int END_OFFSET = 50;
+        runPcUntilOffset(END_OFFSET);
+
+        closePC();
+
+        causeCommittedConsumerGroupOffsetToBeDeleted();
+
+        produceMessages(TO_PRODUCE);
+
+        final int TOTAL_PRODUCED = TO_PRODUCE * 2;
+        runPcCheckStartIs(TOTAL_PRODUCED, TOTAL_PRODUCED);
     }
 
-    void cgOffsetsDeleted() {
-//        ac.deleteConsumerGroupOffsets()
+    @Test
+    void cgOffsetsDeletedResetEarliest() {
+        produceMessages(TO_PRODUCE);
+
+        final int END_OFFSET = 50;
+        runPcUntilOffset(END_OFFSET);
+
+        closePC();
+
+        causeCommittedConsumerGroupOffsetToBeDeleted();
+
+        produceMessages(100);
+
+        runPcCheckStartIs(0, TO_PRODUCE);
+    }
 
+    private void causeCommittedConsumerGroupOffsetToBeDeleted() {
+        throw new RuntimeException();
     }
 
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index cd4f8f99a..840f02b05 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -72,6 +72,7 @@ class PCVersion {
 
     @Getter
     private AdminClient admin;
+
     private String groupId = GROUP_ID_PREFIX + nextInt();
 
     /**
@@ -290,9 +291,14 @@ public List<String> produceMessages(String topicName, long numberToSend) throws
     }
 
     public ParallelEoSStreamProcessor<String, String> buildPc(ProcessingOrder order, CommitMode commitMode, int maxPoll) {
+        return buildPc(order, commitMode, maxPoll, GroupOption.REUSE_GROUP);
+    }
+
+    public ParallelEoSStreamProcessor<String, String> buildPc(ProcessingOrder order, CommitMode commitMode, int maxPoll, GroupOption groupOption) {
         Properties consumerProps = new Properties();
         consumerProps.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, maxPoll);
-        KafkaConsumer<String, String> newConsumer = createNewConsumer(false, consumerProps);
+        boolean newConsumerGroup = groupOption.equals(GroupOption.NEW_GROUP);
+        KafkaConsumer<String, String> newConsumer = createNewConsumer(newConsumerGroup, consumerProps);
         lastConsumerConstructed = newConsumer;
 
         var pc = new ParallelEoSStreamProcessor<>(ParallelConsumerOptions.<String, String>builder()
@@ -308,6 +314,10 @@ public ParallelEoSStreamProcessor<String, String> buildPc(ProcessingOrder order,
         return pc;
     }
 
+    public ParallelEoSStreamProcessor<String, String> buildPc(ProcessingOrder key, GroupOption groupOption) {
+        return buildPc(key, PERIODIC_CONSUMER_ASYNCHRONOUS, 500, groupOption);
+    }
+
     public ParallelEoSStreamProcessor<String, String> buildPc(ProcessingOrder key) {
         return buildPc(key, PERIODIC_CONSUMER_ASYNCHRONOUS, 500);
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java
index b6ac22d26..f176751b4 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/ThreadUtils.java
@@ -29,4 +29,8 @@ public static void sleepLog(final int ms) {
     public static void sleepQuietly(long ms) {
         sleepQuietly((int) ms);
     }
+
+    public static void sleepSecondsLog(int seconds) {
+        sleepLog(seconds * 1000);
+    }
 }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
index 43295b819..73f1555b9 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
@@ -258,12 +258,8 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
             //
             if (assumeWorkingCodec(encoding, encodingsThatFail)) {
-//                long offsetHighestSequentialSucceeded = partitionState.getOffsetHighestSequentialSucceeded();
-//                assertThat(offsetHighestSequentialSucceeded).isEqualTo(0);
                 assertTruth(partitionState).getOffsetHighestSequentialSucceeded().isEqualTo(FIRST_SUCCEEDED_OFFSET);
 
-//                long offsetHighestSucceeded = partitionState.getOffsetHighestSucceeded();
-//                assertThat(offsetHighestSucceeded).isEqualTo(highestSucceeded);
                 assertTruth(partitionState).getOffsetHighestSucceeded().isEqualTo(highestSucceeded);
 
                 long offsetHighestSeen = partitionState.getOffsetHighestSeen();
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index b71c2bd38..ef62a857d 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -30,6 +30,7 @@
  * @see OffsetEncodingTests#ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential
  * @see PartitionState#maybeTruncateBelow
  * @see PartitionState#maybeTruncateOrPruneTrackedOffsets
+ * @see io.confluent.parallelconsumer.integrationTests.state.PartitionStateCommittedOffsetIT
  */
 class PartitionStateCommittedOffsetTest {
 
@@ -125,27 +126,6 @@ private void addPollToState(PartitionState<String, String> state, PolledTestBatc
             }
         }
     }
-//
-//    /**
-//     *
-//     */
-//    @Test
-//    void bootstrapPollOffsetHigherViaManualCGRset() {
-//        // committed state
-//        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
-//
-//        // bootstrap poll
-//        PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset);
-//
-//        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
-//        addPollToState(state, polledTestBatch);
-//
-//        //
-//        OffsetAndMetadata offsetAndMetadata = state.createOffsetAndMetadata();
-//
-//        assertThat(offsetAndMetadata).getOffset().isEqualTo(0L);
-//        state.getAllIncompleteOffsets().containsAll(Range.range(highestSeenOffset).list());
-//    }
 
     /**
      * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
index 1b5d4bf39..31d89cdbc 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PolledTestBatch.java
@@ -4,7 +4,6 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
-import io.confluent.csid.utils.JavaUtils;
 import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import one.util.streamex.LongStreamEx;
 import one.util.streamex.StreamEx;
@@ -20,7 +19,7 @@
 import static org.mockito.Mockito.mock;
 
 /**
- * todo docs
+ * Utility data class for creating test data around polled records from broker.
  *
  * @author Antony Stubbs
  */
@@ -28,8 +27,6 @@ public class PolledTestBatch {
 
     final ModelUtils mu;
 
-    private final long highestSeenOffset;
-
     private final TopicPartition tp;
 
     List<WorkContainer<String, String>> polledBatchWCs;
@@ -41,7 +38,6 @@ public class PolledTestBatch {
     public PolledTestBatch(ModelUtils mu, TopicPartition tp, long fromOffset, long toOffset) {
         this.mu = mu;
         this.tp = tp;
-        this.highestSeenOffset = toOffset;
 
         create(fromOffset, toOffset);
     }
@@ -49,8 +45,6 @@ public PolledTestBatch(ModelUtils mu, TopicPartition tp, long fromOffset, long t
     public PolledTestBatch(ModelUtils mu, TopicPartition tp, List<Long> polledOffsetsWithCompactedRemoved) {
         this.mu = mu;
         this.tp = tp;
-        //noinspection OptionalGetWithoutIsPresent
-        this.highestSeenOffset = JavaUtils.getLast(polledOffsetsWithCompactedRemoved).get();
 
         create(polledOffsetsWithCompactedRemoved);
 

From e630134260eaa693324209c67d7e412e6cbf1291 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 21:17:08 +0100
Subject: [PATCH 100/131] compaction test works

---
 .../BrokerIntegrationTest.java                | 11 ++-
 .../PartitionStateCommittedOffsetIT.java      | 98 +++++++++++++------
 .../utils/KafkaClientUtils.java               |  6 +-
 .../parallelconsumer/state/ModelUtils.java    |  7 +-
 .../src/test/resources/logback-test.xml       |  7 +-
 5 files changed, 93 insertions(+), 36 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
index d4402302f..9cd3a103d 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
@@ -53,6 +53,9 @@ public abstract class BrokerIntegrationTest<K, V> {
             .withEnv("KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR", "1") //transaction.state.log.replication.factor
             .withEnv("KAFKA_TRANSACTION_STATE_LOG_MIN_ISR", "1") //transaction.state.log.min.isr
             .withEnv("KAFKA_TRANSACTION_STATE_LOG_NUM_PARTITIONS", "1") //transaction.state.log.num.partitions
+            //todo need to customise this for this test
+            // default produce batch size is - must be at least higher than it: 16KB
+            .withEnv("KAFKA_LOG_SEGMENT_BYTES", "40000")
             // try to speed up initial consumer group formation
             .withEnv("KAFKA_GROUP_INITIAL_REBALANCE_DELAY_MS", "500") // group.initial.rebalance.delay.ms default: 3000
             .withReuse(true);
@@ -110,9 +113,13 @@ protected CreateTopicsResult ensureTopic(String topic, int numPartitions) {
         return topics;
     }
 
-    @SneakyThrows
     protected List<String> produceMessages(int quantity) {
-        return getKcu().produceMessages(getTopic(), quantity);
+        return produceMessages(quantity, "");
+    }
+
+    @SneakyThrows
+    protected List<String> produceMessages(int quantity, String prefix) {
+        return getKcu().produceMessages(getTopic(), quantity, prefix);
     }
 
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index 67272e227..d9328a0b3 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -4,7 +4,6 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
-import com.google.common.truth.Truth;
 import io.confluent.csid.utils.JavaUtils;
 import io.confluent.csid.utils.ThreadUtils;
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
@@ -27,14 +26,18 @@
 import org.junit.jupiter.api.Test;
 import org.testcontainers.shaded.org.awaitility.Awaitility;
 import pl.tlinkowski.unij.api.UniMaps;
+import pl.tlinkowski.unij.api.UniSets;
 
 import java.util.*;
-import java.util.concurrent.ConcurrentLinkedQueue;
 import java.util.concurrent.Future;
 import java.util.concurrent.atomic.AtomicLong;
 import java.util.stream.Collectors;
 
+import static com.google.common.truth.Truth.assertThat;
+import static com.google.common.truth.Truth.assertWithMessage;
+import static io.confluent.csid.utils.JavaUtils.getLast;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.PARTITION;
+import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.util.concurrent.TimeUnit.SECONDS;
 import static org.testcontainers.shaded.org.hamcrest.Matchers.equalTo;
 import static pl.tlinkowski.unij.api.UniLists.of;
@@ -57,7 +60,7 @@ class PartitionStateCommittedOffsetIT extends BrokerIntegrationTest<String, Stri
 
     TopicPartition tp;
 
-    final int TO_PRODUCE = 200;
+    final int TO_PRODUCE = 20;
 
     @BeforeEach
     void setup() {
@@ -76,12 +79,18 @@ void compactedTopic() {
 
         List<String> keys = produceMessages(TO_PRODUCE);
 
-        final int UNTIL_OFFSET = 50;
-        var processedOnFirstRun = runPcUntilOffset(UNTIL_OFFSET);
+        final int UNTIL_OFFSET = TO_PRODUCE / 2;
+        var processedOnFirstRun = runPcUntilOffset(UNTIL_OFFSET, TO_PRODUCE, UniSets.of(TO_PRODUCE - 3L));
+        assertWithMessage("Last processed should be at least half of the total sent, so that there is incomplete data to track")
+                .that(getLast(processedOnFirstRun).get().offset())
+                .isGreaterThan(TO_PRODUCE / 2);
 
+        // commit offset
         closePC();
 
-        Set<String> tombStonedKeys = new HashSet<>(sendRandomTombstones(keys, UNTIL_OFFSET, TO_PRODUCE));
+        //
+        ArrayList<String> tombStonedKeysRaw = sendRandomTombstones(keys, TO_PRODUCE);
+        Set<String> tombStonedKeys = new HashSet<>(tombStonedKeysRaw);
 
         var processedOnFirstRunWithTombstoneTargetsRemoved = processedOnFirstRun.stream()
                 .filter(context -> !tombStonedKeys.contains(context.key()))
@@ -91,6 +100,11 @@ void compactedTopic() {
         var firstRunPartitioned = processedOnFirstRun.stream().collect(Collectors.partitioningBy(context -> tombStonedKeys.contains(context.key())));
         var saved = firstRunPartitioned.get(Boolean.FALSE);
         var tombstoned = firstRunPartitioned.get(Boolean.TRUE);
+        log.debug("kept offsets: {}", saved.stream().mapToLong(PollContext::offset).boxed().collect(Collectors.toList()));
+        log.debug("kept keys: {}", saved.stream().map(PollContext::key).collect(Collectors.toList()));
+        log.debug("tombstoned offsets: {}", tombstoned.stream().map(PollContext::key).collect(Collectors.toList()));
+        log.debug("tombstoned keys: {}", tombstoned.stream().mapToLong(PollContext::offset).boxed().collect(Collectors.toList()));
+
 
         var tombstoneTargetOffsetsFromFirstRun = tombstoned.stream()
                 .filter(context -> tombStonedKeys.contains(context.key()))
@@ -101,29 +115,37 @@ void compactedTopic() {
                 .map(PartitionStateCommittedOffsetIT::getOffsetFromKey).collect(Collectors.toList());
         log.debug("First run produced, with tombstone targets removed: {}", processedOnFirstRunWithTombstoneTargetsRemoved);
 
+        //
         triggerTombStoneProcessing();
 
         // The offsets of the tombstone targets should not be read in second run
         final int expectedTotalNumberRecordsProduced = TO_PRODUCE + tombStonedOffsetsFromKey.size();
         final int expectedOffsetProcessedToSecondRun = TO_PRODUCE + tombStonedKeys.size();
-        var processedOnSecondRun = runPcUntilOffset(expectedOffsetProcessedToSecondRun);
+        var processedOnSecondRun = runPcUntilOffset(expectedOffsetProcessedToSecondRun).stream()
+                .filter(recordContexts -> !recordContexts.key().contains("compaction-trigger"))
+                .collect(Collectors.toList());
 
-        final List<String> offsetsFromSecondRunFromKey = processedOnSecondRun.stream()
+        //
+        List<String> offsetsFromSecondRunFromKey = processedOnSecondRun.stream()
                 .map(PollContext::key)
                 .collect(Collectors.toList());
 
-        final List<Long> offsetsFromSecond = processedOnSecondRun.stream()
+        assertWithMessage("All keys should still exist")
+                .that(offsetsFromSecondRunFromKey)
+                .containsAtLeastElementsIn(processedOnFirstRun.stream().map(PollContext::key).collect(Collectors.toList()));
+
+        //
+        List<Long> offsetsFromSecond = processedOnSecondRun.stream()
                 .map(PollContext::offset)
                 .collect(Collectors.toList());
 
-        Truth.assertWithMessage("The offsets of the tombstone targets should not be read in second run")
+        assertWithMessage("The offsets of the tombstone targets should not be read in second run")
                 .that(offsetsFromSecond)
                 .containsNoneIn(tombstoneTargetOffsetsFromFirstRun);
+    }
 
-        final int expectedNumberOfRecordsProcessedSecondRun = TO_PRODUCE - tombStonedOffsetsFromKey.size();
-        Truth.assertWithMessage("Processed on second run should be original sent, minus number of tombstones sent")
-                .that(processedOnSecondRun)
-                .hasSize(expectedNumberOfRecordsProcessedSecondRun);
+    private ArrayList<PollContext<String, String>> runPcUntilOffset(int offset) {
+        return runPcUntilOffset(offset, offset, UniSets.of());
     }
 
     private static long getOffsetFromKey(String key) {
@@ -150,13 +172,15 @@ private void setupCompacted() {
 
     @SneakyThrows
     private void triggerTombStoneProcessing() {
-        ThreadUtils.sleepSecondsLog(30);
+        // send a lot of messages to fill up segments
+        List<String> keys = produceMessages(TO_PRODUCE * 2, "log-compaction-trigger-");
+        // or wait?
+        ThreadUtils.sleepSecondsLog(20);
     }
 
     @SneakyThrows
-    private ArrayList<String> sendRandomTombstones(List<String> keys, int from, int to) {
+    private ArrayList<String> sendRandomTombstones(List<String> keys, int howMany) {
         var tombstoneKeys = new ArrayList<String>();
-        var howMany = (to - from) / 3;
         // fix randomness
         List<Future<RecordMetadata>> futures = JavaUtils.getRandom(keys, howMany).stream()
                 .map((String key) -> {
@@ -172,7 +196,12 @@ private ArrayList<String> sendRandomTombstones(List<String> keys, int from, int
             tombstoneOffsets.add(recordMetadata.offset());
         }
 
-        log.debug("Generated tombstones: {}", tombstoneOffsets);
+        tombstoneKeys.sort(Comparator.comparingLong(PartitionStateCommittedOffsetIT::getOffsetFromKey));
+
+        log.debug("Keys to tombstone: {}\n" +
+                        "Offsets of the generated tombstone: {}",
+                tombstoneKeys,
+                tombstoneOffsets);
         return tombstoneKeys;
     }
 
@@ -221,7 +250,7 @@ private void runPcCheckStartIs(long targetStartOffset, long checkUpTo) {
 
         pc.close();
 
-        Truth.assertWithMessage("Offset started as").that(lowest.get()).isEqualTo(targetStartOffset);
+        assertWithMessage("Offset started as").that(lowest.get()).isEqualTo(targetStartOffset);
     }
 
     @SneakyThrows
@@ -237,27 +266,36 @@ private void closePC() {
         pc.close();
     }
 
-    private ArrayList<PollContext<String, String>> runPcUntilOffset(long targetOffset) {
-        this.pc = super.getKcu().buildPc(PARTITION, GroupOption.NEW_GROUP);
+    private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpToOffset, long expectedProcessToOffset, Set<Long> exceptionsToSucceed) {
+        log.debug("Running PC until offset {}", succeedUpToOffset);
+        this.pc = super.getKcu().buildPc(UNORDERED, GroupOption.NEW_GROUP);
 
-        Queue<PollContext<String, String>> concurrentList = new ConcurrentLinkedQueue<>();
-        AtomicLong current = new AtomicLong();
+        SortedSet<PollContext<String, String>> seenOffsets = Collections.synchronizedSortedSet(new TreeSet<>(Comparator.comparingLong(PollContext::offset)));
+        AtomicLong succeededUpTo = new AtomicLong();
         pc.subscribe(of(getTopic()));
         pc.poll(pollContext -> {
+            seenOffsets.add(pollContext);
             long thisOffset = pollContext.offset();
-            if (thisOffset >= targetOffset) {
+            if (exceptionsToSucceed.contains(thisOffset)) {
+                log.debug("Exceptional offset {} succeeded", thisOffset);
+            } else if (thisOffset >= succeedUpToOffset) {
                 log.debug("Failing on {}", thisOffset);
+                throw new RuntimeException("Failing on " + thisOffset);
             } else {
-                log.debug("Processed {}", thisOffset);
-                current.set(thisOffset);
+                succeededUpTo.set(thisOffset);
+                log.debug("Succeeded {}", thisOffset);
             }
-            concurrentList.add(pollContext);
         });
 
-        Awaitility.await().untilAtomic(current, equalTo(targetOffset - 1));
-        log.debug("Consumed up to {}", targetOffset);
+        Awaitility.await().untilAsserted(() -> {
+            assertThat(seenOffsets).isNotEmpty();
+            assertThat(seenOffsets.last().offset()).isGreaterThan(expectedProcessToOffset - 2);
+        });
+        log.debug("Consumed up to {}", succeedUpToOffset);
+
+        pc.close();
 
-        var sorted = new ArrayList<>(concurrentList);
+        var sorted = new ArrayList<>(seenOffsets);
         Collections.sort(sorted, Comparator.comparingLong(PollContext::offset));
         return sorted;
     }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index 840f02b05..da68bb293 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -260,13 +260,17 @@ public List<NewTopic> createTopics(int numTopics) {
     }
 
     public List<String> produceMessages(String topicName, long numberToSend) throws InterruptedException, ExecutionException {
+        return produceMessages(topicName, numberToSend, "");
+    }
+
+    public List<String> produceMessages(String topicName, long numberToSend, String prefix) throws InterruptedException, ExecutionException {
         log.info("Producing {} messages to {}", numberToSend, topicName);
         final List<String> expectedKeys = new ArrayList<>();
         List<Future<RecordMetadata>> sends = new ArrayList<>();
         try (Producer<String, String> kafkaProducer = createNewProducer(false)) {
 
             var mu = new ModelUtils(new PCModuleTestEnv());
-            List<ProducerRecord<String, String>> recs = mu.createProducerRecords(topicName, numberToSend);
+            List<ProducerRecord<String, String>> recs = mu.createProducerRecords(topicName, numberToSend, prefix);
 
             for (var record : recs) {
                 Future<RecordMetadata> send = kafkaProducer.send(record, (meta, exception) -> {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
index 1197e1628..20c45e35c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ModelUtils.java
@@ -80,11 +80,14 @@ public ConsumerGroupMetadata consumerGroupMeta() {
         return new ConsumerGroupMetadata(groupId);
     }
 
-
     public List<ProducerRecord<String, String>> createProducerRecords(String topicName, long numberToSend) {
+        return createProducerRecords(topicName, numberToSend, "");
+    }
+
+    public List<ProducerRecord<String, String>> createProducerRecords(String topicName, long numberToSend, String prefix) {
         List<ProducerRecord<String, String>> recs = new ArrayList<>();
         for (int i = 0; i < numberToSend; i++) {
-            String key = "key-" + i;
+            String key = prefix + "key-" + i;
             ProducerRecord<String, String> record = new ProducerRecord<>(topicName, key, "value-" + i);
             recs.add(record);
         }
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 0a9472e95..257e279ca 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -26,9 +26,14 @@
         <appender-ref ref="STDOUT"/>
     </root>
 
+
+    <!-- current -->
+    <logger name="io.confluent.parallelconsumer.integrationTests.state.PartitionStateCommittedOffsetIT" level="debug"/>
+
+
     <!-- primary -->
     <logger name="io.confluent.parallelconsumer" level="info"/>
-    <!--    <logger name="io.confluent.parallelconsumer" level="debug"/>-->
+    <!--        <logger name="io.confluent.parallelconsumer" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer" level="trace"/>-->
 
     <!-- <logger name="io.confluent.csid" level="debug"/> -->

From 1b73d18b2b643188b87f1b0cf7f8c17abde820a8 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 21:27:13 +0100
Subject: [PATCH 101/131] run compaction on seperate broker

---
 .../BrokerIntegrationTest.java                | 30 ++++++++++++-------
 .../PartitionStateCommittedOffsetIT.java      | 21 +++++++++++--
 2 files changed, 39 insertions(+), 12 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
index 9cd3a103d..8a93a6fed 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
@@ -12,6 +12,7 @@
 import lombok.Getter;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
+import org.apache.commons.lang3.StringUtils;
 import org.apache.kafka.clients.admin.CreateTopicsResult;
 import org.apache.kafka.clients.admin.NewTopic;
 import org.junit.jupiter.api.AfterEach;
@@ -49,16 +50,25 @@ public abstract class BrokerIntegrationTest<K, V> {
      * https://www.testcontainers.org/test_framework_integration/manual_lifecycle_control/#singleton-containers
      * https://github.com/testcontainers/testcontainers-java/pull/1781
      */
-    public static KafkaContainer kafkaContainer = new KafkaContainer(DockerImageName.parse("confluentinc/cp-kafka:7.2.2"))
-            .withEnv("KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR", "1") //transaction.state.log.replication.factor
-            .withEnv("KAFKA_TRANSACTION_STATE_LOG_MIN_ISR", "1") //transaction.state.log.min.isr
-            .withEnv("KAFKA_TRANSACTION_STATE_LOG_NUM_PARTITIONS", "1") //transaction.state.log.num.partitions
-            //todo need to customise this for this test
-            // default produce batch size is - must be at least higher than it: 16KB
-            .withEnv("KAFKA_LOG_SEGMENT_BYTES", "40000")
-            // try to speed up initial consumer group formation
-            .withEnv("KAFKA_GROUP_INITIAL_REBALANCE_DELAY_MS", "500") // group.initial.rebalance.delay.ms default: 3000
-            .withReuse(true);
+    public static KafkaContainer kafkaContainer = createKafkaContainer(null);
+
+    public static KafkaContainer createKafkaContainer(String logSgmentSize) {
+        KafkaContainer base = new KafkaContainer(DockerImageName.parse("confluentinc/cp-kafka:7.2.2"))
+                .withEnv("KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR", "1") //transaction.state.log.replication.factor
+                .withEnv("KAFKA_TRANSACTION_STATE_LOG_MIN_ISR", "1") //transaction.state.log.min.isr
+                .withEnv("KAFKA_TRANSACTION_STATE_LOG_NUM_PARTITIONS", "1") //transaction.state.log.num.partitions
+                //todo need to customise this for this test
+                // default produce batch size is - must be at least higher than it: 16KB
+                // try to speed up initial consumer group formation
+                .withEnv("KAFKA_GROUP_INITIAL_REBALANCE_DELAY_MS", "500") // group.initial.rebalance.delay.ms default: 3000
+                .withReuse(true);
+
+        if (StringUtils.isNotBlank(logSgmentSize)) {
+            base = base.withEnv("KAFKA_LOG_SEGMENT_BYTES", logSgmentSize);
+        }
+
+        return base;
+    }
 
     static {
         kafkaContainer.start();
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index d9328a0b3..84621fe76 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -9,6 +9,7 @@
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import io.confluent.parallelconsumer.PollContext;
 import io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest;
+import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils;
 import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils.GroupOption;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
@@ -24,6 +25,7 @@
 import org.apache.kafka.common.config.TopicConfig;
 import org.junit.jupiter.api.BeforeEach;
 import org.junit.jupiter.api.Test;
+import org.testcontainers.containers.KafkaContainer;
 import org.testcontainers.shaded.org.awaitility.Awaitility;
 import pl.tlinkowski.unij.api.UniMaps;
 import pl.tlinkowski.unij.api.UniSets;
@@ -60,7 +62,7 @@ class PartitionStateCommittedOffsetIT extends BrokerIntegrationTest<String, Stri
 
     TopicPartition tp;
 
-    final int TO_PRODUCE = 20;
+    int TO_PRODUCE = 200;
 
     @BeforeEach
     void setup() {
@@ -75,8 +77,21 @@ void setup() {
      */
     @Test
     void compactedTopic() {
+        // setup our extra special compacting broker
+        KafkaContainer compactingBroker = null;
+        {
+            KafkaContainer compactingBroker = BrokerIntegrationTest.createKafkaContainer("40000");
+            compactingBroker.start();
+            kcu = new KafkaClientUtils(compactingBroker);
+            kcu.open();
+
+            setup();
+        }
+
         setupCompacted();
 
+        var TO_PRODUCE = this.TO_PRODUCE / 10;
+
         List<String> keys = produceMessages(TO_PRODUCE);
 
         final int UNTIL_OFFSET = TO_PRODUCE / 2;
@@ -142,6 +157,8 @@ void compactedTopic() {
         assertWithMessage("The offsets of the tombstone targets should not be read in second run")
                 .that(offsetsFromSecond)
                 .containsNoneIn(tombstoneTargetOffsetsFromFirstRun);
+
+        compactingBroker.close();
     }
 
     private ArrayList<PollContext<String, String>> runPcUntilOffset(int offset) {
@@ -175,7 +192,7 @@ private void triggerTombStoneProcessing() {
         // send a lot of messages to fill up segments
         List<String> keys = produceMessages(TO_PRODUCE * 2, "log-compaction-trigger-");
         // or wait?
-        ThreadUtils.sleepSecondsLog(20);
+        ThreadUtils.sleepSecondsLog(10);
     }
 
     @SneakyThrows

From bd52b2cb6e531141a8064299d2fb3202fda95f2a Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Tue, 11 Oct 2022 22:35:40 +0100
Subject: [PATCH 102/131] compaction test review, fix higher / lower tests

---
 CHANGELOG.adoc                                |  3 +-
 .../AbstractParallelEoSStreamProcessor.java   |  4 +-
 .../state/PartitionState.java                 | 35 ++++---
 .../PartitionStateCommittedOffsetIT.java      | 93 ++++++++++++-------
 .../utils/KafkaClientUtils.java               |  1 +
 5 files changed, 88 insertions(+), 48 deletions(-)

diff --git a/CHANGELOG.adoc b/CHANGELOG.adoc
index 5243de648..5043a8334 100644
--- a/CHANGELOG.adoc
+++ b/CHANGELOG.adoc
@@ -18,7 +18,8 @@ endif::[]
 
 === Fixes
 
-* fixes #409: Truncate state when bootstrap polled offset higher or lower than committed and prune missing records (#425)
+* fixes #409: Fixes support for compacted topics and when commit offset is reset
+** Truncate state when bootstrap polled offset higher or lower than committed and prune missing records (#425)
 
 == 0.5.2.3
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
index 8ad18b983..893e8a457 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
@@ -246,7 +246,9 @@ protected AbstractParallelEoSStreamProcessor(ParallelConsumerOptions<K, V> newOp
 
         module.setParallelEoSStreamProcessor(this);
 
-        log.info("Confluent Parallel Consumer initialise... Options: {}", newOptions);
+        log.info("Confluent Parallel Consumer initialise... groupId: {}, Options: {}",
+                newOptions.getConsumer().groupMetadata().groupId(),
+                newOptions);
 
         options = newOptions;
         options.validate();
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 12ced89b1..f114023ae 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -272,7 +272,7 @@ private void maybeTruncateBelowOrAbove(long polledOffset) {
 
         if (pollAboveExpected) {
             // previously committed offset record has been removed, or manual reset to higher offset detected
-            log.warn("Truncating state - removing records lower than {}. Offsets have been removed form the partition by the broker. Bootstrap polled {} but " +
+            log.warn("Truncating state - removing records lower than {}. Offsets have been removed from the partition by the broker. Bootstrap polled {} but " +
                             "expected {} from loaded commit data. Could be caused by record retention or compaction.",
                     polledOffset,
                     polledOffset,
@@ -472,7 +472,7 @@ protected void maybeTruncateOrPruneTrackedOffsets(EpochAndRecordsMap<?, ?>.Recor
         var records = polledRecordBatch.getRecords();
 
         if (records.isEmpty()) {
-            log.warn("Polled an emtpy batch of records? {}", polledRecordBatch);
+            log.warn("Polled an empty batch of records? {}", polledRecordBatch);
             return;
         }
 
@@ -489,25 +489,30 @@ protected void maybeTruncateOrPruneTrackedOffsets(EpochAndRecordsMap<?, ?>.Recor
 
         // for the incomplete offsets within this range of poll batch
         var incompletesWithinPolledBatch = incompleteOffsets.subSet(low, true, high, true);
-
+        var offsetsToRemoveFromTracking = new ArrayList<Long>();
         for (long incompleteOffset : incompletesWithinPolledBatch) {
             boolean offsetMissingFromPolledRecords = !polledOffsetLookup.contains(incompleteOffset);
+
             if (offsetMissingFromPolledRecords) {
-                log.warn("Offset {} has been removed from partition {} (as it has not been returned within a polled batch " +
-                                "which should have contained it - batch offset range is {} to {}), so it must be removed " +
-                                "from tracking state, as it will never be sent again to be retried. " +
-                                "This can be caused by PC rebalancing across a partition which has been compacted on offsets above the committed " +
-                                "base offset, after initial load and before a rebalance.",
-                        incompleteOffset,
-                        getTp(),
-                        low,
-                        high
-                );
-                boolean removedCheck = incompleteOffsets.remove(incompleteOffset);
-                assert removedCheck;
+                offsetsToRemoveFromTracking.add(incompleteOffset);
                 // don't need to remove it from the #commitQueue, as it would never have been added
             }
         }
+        if (!offsetsToRemoveFromTracking.isEmpty()) {
+            log.warn("Offsets {} have been removed from partition {} (as they were not been returned within a polled batch " +
+                            "which should have contained them - batch offset range is {} to {}), so they be removed " +
+                            "from tracking state, as they will never be sent again to be retried. " +
+                            "This can be caused by PC rebalancing across a partition which has been compacted on offsets above the committed " +
+                            "base offset, after initial load and before a rebalance.",
+                    offsetsToRemoveFromTracking,
+                    getTp(),
+                    low,
+                    high
+            );
+            boolean removedCheck = incompleteOffsets.removeAll(offsetsToRemoveFromTracking);
+            assert removedCheck;
+        }
+
     }
 
 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index 84621fe76..546207c76 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -80,7 +80,7 @@ void compactedTopic() {
         // setup our extra special compacting broker
         KafkaContainer compactingBroker = null;
         {
-            KafkaContainer compactingBroker = BrokerIntegrationTest.createKafkaContainer("40000");
+            compactingBroker = BrokerIntegrationTest.createKafkaContainer("40000");
             compactingBroker.start();
             kcu = new KafkaClientUtils(compactingBroker);
             kcu.open();
@@ -104,39 +104,39 @@ void compactedTopic() {
         closePC();
 
         //
-        ArrayList<String> tombStonedKeysRaw = sendRandomTombstones(keys, TO_PRODUCE);
-        Set<String> tombStonedKeys = new HashSet<>(tombStonedKeysRaw);
+        ArrayList<String> compactionKeysRaw = sendRandomCompactionRecords(keys, TO_PRODUCE);
+        Set<String> compactedKeys = new HashSet<>(compactionKeysRaw);
 
         var processedOnFirstRunWithTombstoneTargetsRemoved = processedOnFirstRun.stream()
-                .filter(context -> !tombStonedKeys.contains(context.key()))
+                .filter(context -> !compactedKeys.contains(context.key()))
                 .map(PollContext::key)
                 .collect(Collectors.toList());
 
-        var firstRunPartitioned = processedOnFirstRun.stream().collect(Collectors.partitioningBy(context -> tombStonedKeys.contains(context.key())));
+        var firstRunPartitioned = processedOnFirstRun.stream().collect(Collectors.partitioningBy(context -> compactedKeys.contains(context.key())));
         var saved = firstRunPartitioned.get(Boolean.FALSE);
-        var tombstoned = firstRunPartitioned.get(Boolean.TRUE);
+        var compacted = firstRunPartitioned.get(Boolean.TRUE);
         log.debug("kept offsets: {}", saved.stream().mapToLong(PollContext::offset).boxed().collect(Collectors.toList()));
         log.debug("kept keys: {}", saved.stream().map(PollContext::key).collect(Collectors.toList()));
-        log.debug("tombstoned offsets: {}", tombstoned.stream().map(PollContext::key).collect(Collectors.toList()));
-        log.debug("tombstoned keys: {}", tombstoned.stream().mapToLong(PollContext::offset).boxed().collect(Collectors.toList()));
+        log.debug("compacted offsets: {}", compacted.stream().map(PollContext::key).collect(Collectors.toList()));
+        log.debug("compacted keys: {}", compacted.stream().mapToLong(PollContext::offset).boxed().collect(Collectors.toList()));
 
 
-        var tombstoneTargetOffsetsFromFirstRun = tombstoned.stream()
-                .filter(context -> tombStonedKeys.contains(context.key()))
+        var tombstoneTargetOffsetsFromFirstRun = compacted.stream()
+                .filter(context -> compactedKeys.contains(context.key()))
                 .map(PollContext::offset)
                 .collect(Collectors.toList());
 
-        var tombStonedOffsetsFromKey = tombStonedKeys.stream()
+        var tombStonedOffsetsFromKey = compactedKeys.stream()
                 .map(PartitionStateCommittedOffsetIT::getOffsetFromKey).collect(Collectors.toList());
-        log.debug("First run produced, with tombstone targets removed: {}", processedOnFirstRunWithTombstoneTargetsRemoved);
+        log.debug("First run produced, with compaction targets removed: {}", processedOnFirstRunWithTombstoneTargetsRemoved);
 
         //
         triggerTombStoneProcessing();
 
         // The offsets of the tombstone targets should not be read in second run
         final int expectedTotalNumberRecordsProduced = TO_PRODUCE + tombStonedOffsetsFromKey.size();
-        final int expectedOffsetProcessedToSecondRun = TO_PRODUCE + tombStonedKeys.size();
-        var processedOnSecondRun = runPcUntilOffset(expectedOffsetProcessedToSecondRun).stream()
+        final int expectedOffsetProcessedToSecondRun = TO_PRODUCE + compactedKeys.size();
+        var processedOnSecondRun = runPcUntilOffset(expectedOffsetProcessedToSecondRun, GroupOption.REUSE_GROUP).stream()
                 .filter(recordContexts -> !recordContexts.key().contains("compaction-trigger"))
                 .collect(Collectors.toList());
 
@@ -145,16 +145,25 @@ void compactedTopic() {
                 .map(PollContext::key)
                 .collect(Collectors.toList());
 
-        assertWithMessage("All keys should still exist")
-                .that(offsetsFromSecondRunFromKey)
-                .containsAtLeastElementsIn(processedOnFirstRun.stream().map(PollContext::key).collect(Collectors.toList()));
+//        assertWithMessage("All keys should still exist")
+//                .that(offsetsFromSecondRunFromKey)
+//                .containsAtLeastElementsIn(processedOnFirstRun.stream().map(PollContext::key).collect(Collectors.toList()));
 
         //
         List<Long> offsetsFromSecond = processedOnSecondRun.stream()
                 .map(PollContext::offset)
                 .collect(Collectors.toList());
 
-        assertWithMessage("The offsets of the tombstone targets should not be read in second run")
+//        assertWithMessage("The offsets of the tombstone targets should not be read in second run")
+//                .that(offsetsFromSecond)
+//                .containsNoneIn(tombstoneTargetOffsetsFromFirstRun);
+
+        assertWithMessage("Finish reading rest of records from %s to %s",
+                UNTIL_OFFSET,
+                TO_PRODUCE)
+                .that(processedOnSecondRun.size()).isGreaterThan(TO_PRODUCE - UNTIL_OFFSET);
+
+        assertWithMessage("Off the offsets read on the second run, offsets that were compacted (below the initial produce target) should now be removed, as they were replaced with newer ones.")
                 .that(offsetsFromSecond)
                 .containsNoneIn(tombstoneTargetOffsetsFromFirstRun);
 
@@ -162,7 +171,11 @@ void compactedTopic() {
     }
 
     private ArrayList<PollContext<String, String>> runPcUntilOffset(int offset) {
-        return runPcUntilOffset(offset, offset, UniSets.of());
+        return runPcUntilOffset(offset, offset, UniSets.of(), GroupOption.NEW_GROUP);
+    }
+
+    private ArrayList<PollContext<String, String>> runPcUntilOffset(int offset, GroupOption reuseGroup) {
+        return runPcUntilOffset(Long.MAX_VALUE, offset, UniSets.of(), reuseGroup);
     }
 
     private static long getOffsetFromKey(String key) {
@@ -192,17 +205,19 @@ private void triggerTombStoneProcessing() {
         // send a lot of messages to fill up segments
         List<String> keys = produceMessages(TO_PRODUCE * 2, "log-compaction-trigger-");
         // or wait?
-        ThreadUtils.sleepSecondsLog(10);
+        final int pauseSeconds = 20;
+        log.info("Pausing for {} seconds to allow for compaction", pauseSeconds);
+        ThreadUtils.sleepSecondsLog(pauseSeconds);
     }
 
     @SneakyThrows
-    private ArrayList<String> sendRandomTombstones(List<String> keys, int howMany) {
+    private ArrayList<String> sendRandomCompactionRecords(List<String> keys, int howMany) {
         var tombstoneKeys = new ArrayList<String>();
         // fix randomness
         List<Future<RecordMetadata>> futures = JavaUtils.getRandom(keys, howMany).stream()
                 .map((String key) -> {
                     tombstoneKeys.add(key);
-                    var tombstone = new ProducerRecord<>(getTopic(), key, "tombstone");
+                    var tombstone = new ProducerRecord<>(getTopic(), key, "compactor");
                     return getKcu().getProducer()
                             .send(tombstone);
                 })
@@ -235,7 +250,7 @@ void committedOffsetLower() {
 
         final int moveToOffset = 25;
 
-        moveCommittedOffset(moveToOffset);
+        moveCommittedOffset(kcu.getGroupId(), moveToOffset);
 
         runPcCheckStartIs(moveToOffset, TO_PRODUCE);
     }
@@ -246,8 +261,8 @@ void committedOffsetLower() {
      * @param targetStartOffset the offset to check that PC starts at
      * @param checkUpTo         the offset to run the PC until, while checking for the start offset
      */
-    private void runPcCheckStartIs(long targetStartOffset, long checkUpTo) {
-        this.pc = super.getKcu().buildPc(PARTITION);
+    private void runPcCheckStartIs(long targetStartOffset, long checkUpTo, GroupOption groupOption) {
+        this.pc = super.getKcu().buildPc(PARTITION, groupOption);
         pc.subscribe(of(getTopic()));
 
         AtomicLong lowest = new AtomicLong(Long.MAX_VALUE);
@@ -270,9 +285,13 @@ private void runPcCheckStartIs(long targetStartOffset, long checkUpTo) {
         assertWithMessage("Offset started as").that(lowest.get()).isEqualTo(targetStartOffset);
     }
 
+    private void moveCommittedOffset(int moveToOffset) {
+        moveCommittedOffset(groupId, moveToOffset);
+    }
+
     @SneakyThrows
-    private void moveCommittedOffset(long offset) {
-        log.debug("Moving offset to {}", offset);
+    private void moveCommittedOffset(String groupId, long offset) {
+        log.debug("Moving offset of {} to {}", groupId, offset);
         var data = UniMaps.of(tp, new OffsetAndMetadata(offset));
         var result = ac.alterConsumerGroupOffsets(groupId, data);
         result.all().get(5, SECONDS);
@@ -283,9 +302,14 @@ private void closePC() {
         pc.close();
     }
 
+
     private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpToOffset, long expectedProcessToOffset, Set<Long> exceptionsToSucceed) {
+        return runPcUntilOffset(succeedUpToOffset, expectedProcessToOffset, exceptionsToSucceed, GroupOption.NEW_GROUP);
+    }
+
+    private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpToOffset, long expectedProcessToOffset, Set<Long> exceptionsToSucceed, GroupOption newGroup) {
         log.debug("Running PC until offset {}", succeedUpToOffset);
-        this.pc = super.getKcu().buildPc(UNORDERED, GroupOption.NEW_GROUP);
+        this.pc = super.getKcu().buildPc(UNORDERED, newGroup);
 
         SortedSet<PollContext<String, String>> seenOffsets = Collections.synchronizedSortedSet(new TreeSet<>(Comparator.comparingLong(PollContext::offset)));
         AtomicLong succeededUpTo = new AtomicLong();
@@ -300,7 +324,7 @@ private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpTo
                 throw new RuntimeException("Failing on " + thisOffset);
             } else {
                 succeededUpTo.set(thisOffset);
-                log.debug("Succeeded {}", thisOffset);
+                log.debug("Succeeded {}: {}", thisOffset, pollContext.getSingleRecord());
             }
         });
 
@@ -308,7 +332,7 @@ private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpTo
             assertThat(seenOffsets).isNotEmpty();
             assertThat(seenOffsets.last().offset()).isGreaterThan(expectedProcessToOffset - 2);
         });
-        log.debug("Consumed up to {}", succeedUpToOffset);
+        log.debug("Consumed up to {}", seenOffsets.last().offset());
 
         pc.close();
 
@@ -331,9 +355,16 @@ void committedOffsetHigher() {
 
         final int moveToOffset = 75;
 
-        moveCommittedOffset(moveToOffset);
+        // reslolve groupId mess
+        moveCommittedOffset(kcu.getGroupId(), moveToOffset);
 
         runPcCheckStartIs(moveToOffset, quantity);
+        var gkcu5 = kcu.getConsumer().groupMetadata().groupId();
+
+    }
+
+    private void runPcCheckStartIs(int targetStartOffset, int checkUpTo) {
+        runPcCheckStartIs(targetStartOffset, checkUpTo, GroupOption.REUSE_GROUP);
     }
 
     /**
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index da68bb293..01467e9fe 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -73,6 +73,7 @@ class PCVersion {
     @Getter
     private AdminClient admin;
 
+    @Getter
     private String groupId = GROUP_ID_PREFIX + nextInt();
 
     /**

From 97f3c438f2b7054f05b55f5bcbf0d91add724323 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 00:18:47 +0100
Subject: [PATCH 103/131] offset removed test works for RESET == EARLIEST

---
 .../state/PartitionState.java                 |   2 +-
 .../BrokerIntegrationTest.java                |   9 +-
 .../PartitionStateCommittedOffsetIT.java      | 121 ++++++++++++++----
 .../utils/KafkaClientUtils.java               |   8 +-
 .../src/test/resources/logback-test.xml       |   2 +-
 5 files changed, 109 insertions(+), 33 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index f114023ae..01b661ddc 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -272,7 +272,7 @@ private void maybeTruncateBelowOrAbove(long polledOffset) {
 
         if (pollAboveExpected) {
             // previously committed offset record has been removed, or manual reset to higher offset detected
-            log.warn("Truncating state - removing records lower than {}. Offsets have been removed from the partition by the broker. Bootstrap polled {} but " +
+            log.warn("Truncating state - removing records lower than {}. Offsets have been removed from the partition by the broker or committed offset has been raised. Bootstrap polled {} but " +
                             "expected {} from loaded commit data. Could be caused by record retention or compaction.",
                     polledOffset,
                     polledOffset,
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
index 8a93a6fed..50f5a5b6c 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/BrokerIntegrationTest.java
@@ -25,6 +25,7 @@
 
 import java.util.List;
 import java.util.concurrent.ExecutionException;
+import java.util.concurrent.TimeUnit;
 
 import static org.apache.commons.lang3.RandomUtils.nextInt;
 import static org.assertj.core.api.Assertions.assertThat;
@@ -52,7 +53,7 @@ public abstract class BrokerIntegrationTest<K, V> {
      */
     public static KafkaContainer kafkaContainer = createKafkaContainer(null);
 
-    public static KafkaContainer createKafkaContainer(String logSgmentSize) {
+    public static KafkaContainer createKafkaContainer(String logSegmentSize) {
         KafkaContainer base = new KafkaContainer(DockerImageName.parse("confluentinc/cp-kafka:7.2.2"))
                 .withEnv("KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR", "1") //transaction.state.log.replication.factor
                 .withEnv("KAFKA_TRANSACTION_STATE_LOG_MIN_ISR", "1") //transaction.state.log.min.isr
@@ -63,8 +64,8 @@ public static KafkaContainer createKafkaContainer(String logSgmentSize) {
                 .withEnv("KAFKA_GROUP_INITIAL_REBALANCE_DELAY_MS", "500") // group.initial.rebalance.delay.ms default: 3000
                 .withReuse(true);
 
-        if (StringUtils.isNotBlank(logSgmentSize)) {
-            base = base.withEnv("KAFKA_LOG_SEGMENT_BYTES", logSgmentSize);
+        if (StringUtils.isNotBlank(logSegmentSize)) {
+            base = base.withEnv("KAFKA_LOG_SEGMENT_BYTES", logSegmentSize);
         }
 
         return base;
@@ -114,7 +115,7 @@ protected CreateTopicsResult ensureTopic(String topic, int numPartitions) {
         NewTopic e1 = new NewTopic(topic, numPartitions, (short) 1);
         CreateTopicsResult topics = kcu.getAdmin().createTopics(UniLists.of(e1));
         try {
-            Void all = topics.all().get();
+            Void all = topics.all().get(1, TimeUnit.SECONDS);
         } catch (ExecutionException e) {
             // fine
         } catch (Exception e) {
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index 546207c76..b5da46b05 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -6,16 +6,21 @@
 
 import io.confluent.csid.utils.JavaUtils;
 import io.confluent.csid.utils.ThreadUtils;
+import io.confluent.parallelconsumer.ManagedTruth;
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import io.confluent.parallelconsumer.PollContext;
 import io.confluent.parallelconsumer.integrationTests.BrokerIntegrationTest;
 import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils;
 import io.confluent.parallelconsumer.integrationTests.utils.KafkaClientUtils.GroupOption;
+import lombok.NonNull;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import org.apache.kafka.clients.admin.AdminClient;
 import org.apache.kafka.clients.admin.AlterConfigOp;
 import org.apache.kafka.clients.admin.ConfigEntry;
+import org.apache.kafka.clients.consumer.ConsumerRecord;
+import org.apache.kafka.clients.consumer.ConsumerRecords;
+import org.apache.kafka.clients.consumer.KafkaConsumer;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.clients.producer.ProducerRecord;
 import org.apache.kafka.clients.producer.RecordMetadata;
@@ -30,8 +35,11 @@
 import pl.tlinkowski.unij.api.UniMaps;
 import pl.tlinkowski.unij.api.UniSets;
 
+import java.time.Duration;
 import java.util.*;
+import java.util.concurrent.ExecutionException;
 import java.util.concurrent.Future;
+import java.util.concurrent.TimeoutException;
 import java.util.concurrent.atomic.AtomicLong;
 import java.util.stream.Collectors;
 
@@ -41,7 +49,7 @@
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.PARTITION;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.util.concurrent.TimeUnit.SECONDS;
-import static org.testcontainers.shaded.org.hamcrest.Matchers.equalTo;
+import static org.testcontainers.shaded.org.hamcrest.Matchers.greaterThanOrEqualTo;
 import static pl.tlinkowski.unij.api.UniLists.of;
 
 /**
@@ -77,18 +85,7 @@ void setup() {
      */
     @Test
     void compactedTopic() {
-        // setup our extra special compacting broker
-        KafkaContainer compactingBroker = null;
-        {
-            compactingBroker = BrokerIntegrationTest.createKafkaContainer("40000");
-            compactingBroker.start();
-            kcu = new KafkaClientUtils(compactingBroker);
-            kcu.open();
-
-            setup();
-        }
-
-        setupCompacted();
+        KafkaContainer compactingBroker = setupCompactingKafkaBroker();
 
         var TO_PRODUCE = this.TO_PRODUCE / 10;
 
@@ -170,6 +167,26 @@ void compactedTopic() {
         compactingBroker.close();
     }
 
+    /**
+     * Setup our extra special compacting broker
+     */
+    @NonNull
+    private KafkaContainer setupCompactingKafkaBroker() {
+        KafkaContainer compactingBroker = null;
+        {
+            compactingBroker = BrokerIntegrationTest.createKafkaContainer("40000");
+            compactingBroker.start();
+            kcu = new KafkaClientUtils(compactingBroker);
+            kcu.open();
+
+            setup();
+        }
+
+        setupCompacted();
+
+        return compactingBroker;
+    }
+
     private ArrayList<PollContext<String, String>> runPcUntilOffset(int offset) {
         return runPcUntilOffset(offset, offset, UniSets.of(), GroupOption.NEW_GROUP);
     }
@@ -278,7 +295,7 @@ private void runPcCheckStartIs(long targetStartOffset, long checkUpTo, GroupOpti
             }
         });
 
-        Awaitility.await().untilAtomic(highest, equalTo(checkUpTo - 1));
+        Awaitility.await().untilAtomic(highest, greaterThanOrEqualTo(checkUpTo - 1));
 
         pc.close();
 
@@ -312,7 +329,7 @@ private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpTo
         this.pc = super.getKcu().buildPc(UNORDERED, newGroup);
 
         SortedSet<PollContext<String, String>> seenOffsets = Collections.synchronizedSortedSet(new TreeSet<>(Comparator.comparingLong(PollContext::offset)));
-        AtomicLong succeededUpTo = new AtomicLong();
+        SortedSet<PollContext<String, String>> succeededOffsets = Collections.synchronizedSortedSet(new TreeSet<>(Comparator.comparingLong(PollContext::offset)));
         pc.subscribe(of(getTopic()));
         pc.poll(pollContext -> {
             seenOffsets.add(pollContext);
@@ -323,8 +340,8 @@ private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpTo
                 log.debug("Failing on {}", thisOffset);
                 throw new RuntimeException("Failing on " + thisOffset);
             } else {
-                succeededUpTo.set(thisOffset);
                 log.debug("Succeeded {}: {}", thisOffset, pollContext.getSingleRecord());
+                succeededOffsets.add(pollContext);
             }
         });
 
@@ -332,7 +349,7 @@ private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpTo
             assertThat(seenOffsets).isNotEmpty();
             assertThat(seenOffsets.last().offset()).isGreaterThan(expectedProcessToOffset - 2);
         });
-        log.debug("Consumed up to {}", seenOffsets.last().offset());
+        log.debug("Succeeded up to: {} Consumed up to {}", succeededOffsets.last().offset(), seenOffsets.last().offset());
 
         pc.close();
 
@@ -373,23 +390,75 @@ private void runPcCheckStartIs(int targetStartOffset, int checkUpTo) {
      */
     @Test
     void committedOffsetRemoved() {
-        produceMessages(TO_PRODUCE);
+        try (KafkaContainer compactingKafkaBroker = setupCompactingKafkaBroker()) {
+//            KafkaContainer compactingKafkaBroker = setupCompactingKafkaBroker();
+            log.debug("Compacting broker started {}", compactingKafkaBroker);
 
-        final int END_OFFSET = 50;
-        runPcUntilOffset(END_OFFSET);
+            var producedCount = produceMessages(TO_PRODUCE).size();
 
-        closePC();
+            final int END_OFFSET = 50;
+            groupId = getKcu().getGroupId();
+            runPcUntilOffset(END_OFFSET);
 
-        causeCommittedOffsetToBeRemoved(END_OFFSET);
+            closePC();
 
-        produceMessages(TO_PRODUCE);
+            final String compactedKey = "key-50";
 
-        final int TOTAL = TO_PRODUCE * 2;
-        runPcCheckStartIs(END_OFFSET + 1, TOTAL);
+            // before compaction
+            checkHowManyRecordsWithKeyPresent(compactedKey, 1, TO_PRODUCE);
+
+            causeCommittedOffsetToBeRemoved(END_OFFSET);
+
+            // after compaction
+            checkHowManyRecordsWithKeyPresent(compactedKey, 1, TO_PRODUCE + 2);
+
+            producedCount = producedCount + produceMessages(TO_PRODUCE).size();
+
+            final int TOTAL = TO_PRODUCE * 2;
+
+            getKcu().setGroupId(groupId);
+            final int EXPECTED_RESET_OFFSET = 0;
+            runPcCheckStartIs(EXPECTED_RESET_OFFSET, producedCount);
+        }
     }
 
+    private void checkHowManyRecordsWithKeyPresent(String keyToSearchFor, int expectedQuantityToFind, long upToOffset) {
+        log.debug("Looking for {} records with key {} up to offset {}", expectedQuantityToFind, keyToSearchFor, upToOffset);
+
+        KafkaConsumer<String, String> newConsumer = kcu.createNewConsumer(GroupOption.NEW_GROUP);
+        newConsumer.subscribe(of(getTopic()));
+        newConsumer.seekToBeginning(UniSets.of());
+        final List<ConsumerRecord<String, String>> records = new ArrayList<>();
+        long highest = -1;
+        while (highest < upToOffset - 1) {
+            ConsumerRecords<String, String> poll = newConsumer.poll(Duration.ofSeconds(1));
+            records.addAll(poll.records(tp));
+            var lastOpt = getLast(records);
+            if (lastOpt.isPresent()) {
+                highest = lastOpt.get().offset();
+            }
+        }
+
+        var collect = records.stream().filter(value -> value.key().equals(keyToSearchFor)).collect(Collectors.toList());
+        ManagedTruth.assertThat(collect).hasSize(expectedQuantityToFind);
+    }
+
+    @SneakyThrows
     private void causeCommittedOffsetToBeRemoved(long offset) {
-        throw new RuntimeException();
+        sendCompactionKeyForOffset(offset);
+        sendCompactionKeyForOffset(offset + 1);
+
+        checkHowManyRecordsWithKeyPresent("key-" + offset, 2, TO_PRODUCE + 2);
+
+        triggerTombStoneProcessing();
+    }
+
+    private void sendCompactionKeyForOffset(long offset) throws InterruptedException, ExecutionException, TimeoutException {
+        String key = "key-" + offset;
+        ProducerRecord<String, String> compactingRecord = new ProducerRecord<>(getTopic(), 0, key, "compactor");
+        getKcu().getProducer()
+                .send(compactingRecord)
+                .get(1, SECONDS);
     }
 
     @Test
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index 01467e9fe..329f669f9 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -11,6 +11,7 @@
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.state.ModelUtils;
 import lombok.Getter;
+import lombok.Setter;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
 import one.util.streamex.IntStreamEx;
@@ -74,6 +75,7 @@ class PCVersion {
     private AdminClient admin;
 
     @Getter
+    @Setter
     private String groupId = GROUP_ID_PREFIX + nextInt();
 
     /**
@@ -110,12 +112,16 @@ private Properties setupConsumerProps(String groupIdToUse) {
 
         //
         consumerProps.put(ConsumerConfig.GROUP_ID_CONFIG, groupIdToUse);
-        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, OffsetResetStrategy.EARLIEST.name().toLowerCase());
         consumerProps.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, false);
         consumerProps.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
         consumerProps.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
         consumerProps.put(ConsumerConfig.ISOLATION_LEVEL_CONFIG, IsolationLevel.READ_COMMITTED.toString().toLowerCase(Locale.ROOT));
 
+        // Reset
+        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, OffsetResetStrategy.EARLIEST.name().toLowerCase());
+//        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, OffsetResetStrategy.LATEST.name().toLowerCase());
+//        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, OffsetResetStrategy.NONE.name().toLowerCase());
+
         //
         //    consumerProps.put(ConsumerConfig.HEARTBEAT_INTERVAL_MS_CONFIG, 10);
         //    consumerProps.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, 100);
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 257e279ca..8fce65ad1 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -33,7 +33,7 @@
 
     <!-- primary -->
     <logger name="io.confluent.parallelconsumer" level="info"/>
-    <!--        <logger name="io.confluent.parallelconsumer" level="debug"/>-->
+    <!--    <logger name="io.confluent.parallelconsumer" level="debug"/>-->
     <!--    <logger name="io.confluent.parallelconsumer" level="trace"/>-->
 
     <!-- <logger name="io.confluent.csid" level="debug"/> -->

From 9bcb14e588a9eb3fbc42e4bfe2ae8b6927cea59c Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 01:48:49 +0100
Subject: [PATCH 104/131] PartitionStateCommittedOffsetIT all green

---
 .../PartitionStateCommittedOffsetIT.java      | 187 ++++++++++--------
 .../utils/KafkaClientUtils.java               |   7 +-
 2 files changed, 113 insertions(+), 81 deletions(-)

diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index b5da46b05..0814e6a2d 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -4,6 +4,7 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import com.google.common.truth.Truth;
 import io.confluent.csid.utils.JavaUtils;
 import io.confluent.csid.utils.ThreadUtils;
 import io.confluent.parallelconsumer.ManagedTruth;
@@ -15,13 +16,11 @@
 import lombok.NonNull;
 import lombok.SneakyThrows;
 import lombok.extern.slf4j.Slf4j;
+import org.apache.commons.lang3.exception.ExceptionUtils;
 import org.apache.kafka.clients.admin.AdminClient;
 import org.apache.kafka.clients.admin.AlterConfigOp;
 import org.apache.kafka.clients.admin.ConfigEntry;
-import org.apache.kafka.clients.consumer.ConsumerRecord;
-import org.apache.kafka.clients.consumer.ConsumerRecords;
-import org.apache.kafka.clients.consumer.KafkaConsumer;
-import org.apache.kafka.clients.consumer.OffsetAndMetadata;
+import org.apache.kafka.clients.consumer.*;
 import org.apache.kafka.clients.producer.ProducerRecord;
 import org.apache.kafka.clients.producer.RecordMetadata;
 import org.apache.kafka.common.KafkaFuture;
@@ -30,8 +29,11 @@
 import org.apache.kafka.common.config.TopicConfig;
 import org.junit.jupiter.api.BeforeEach;
 import org.junit.jupiter.api.Test;
+import org.junit.jupiter.params.ParameterizedTest;
+import org.junit.jupiter.params.provider.EnumSource;
 import org.testcontainers.containers.KafkaContainer;
 import org.testcontainers.shaded.org.awaitility.Awaitility;
+import pl.tlinkowski.unij.api.UniLists;
 import pl.tlinkowski.unij.api.UniMaps;
 import pl.tlinkowski.unij.api.UniSets;
 
@@ -49,7 +51,6 @@
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.PARTITION;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
 import static java.util.concurrent.TimeUnit.SECONDS;
-import static org.testcontainers.shaded.org.hamcrest.Matchers.greaterThanOrEqualTo;
 import static pl.tlinkowski.unij.api.UniLists.of;
 
 /**
@@ -62,6 +63,7 @@
 @Slf4j
 class PartitionStateCommittedOffsetIT extends BrokerIntegrationTest<String, String> {
 
+    public static final OffsetResetStrategy DEFAULT_OFFSET_RESET_POLICY = OffsetResetStrategy.EARLIEST;
     AdminClient ac;
 
     String groupId;
@@ -72,6 +74,8 @@ class PartitionStateCommittedOffsetIT extends BrokerIntegrationTest<String, Stri
 
     int TO_PRODUCE = 200;
 
+    private OffsetResetStrategy offsetResetStrategy = DEFAULT_OFFSET_RESET_POLICY;
+
     @BeforeEach
     void setup() {
         setupTopic();
@@ -187,12 +191,16 @@ private KafkaContainer setupCompactingKafkaBroker() {
         return compactingBroker;
     }
 
-    private ArrayList<PollContext<String, String>> runPcUntilOffset(int offset) {
-        return runPcUntilOffset(offset, offset, UniSets.of(), GroupOption.NEW_GROUP);
+    private List<PollContext<String, String>> runPcUntilOffset(int offset) {
+        return runPcUntilOffset(DEFAULT_OFFSET_RESET_POLICY, offset);
+    }
+
+    private List<PollContext<String, String>> runPcUntilOffset(OffsetResetStrategy offsetResetPolicy, int offset) {
+        return runPcUntilOffset(offsetResetPolicy, offset, offset, UniSets.of(), GroupOption.NEW_GROUP);
     }
 
-    private ArrayList<PollContext<String, String>> runPcUntilOffset(int offset, GroupOption reuseGroup) {
-        return runPcUntilOffset(Long.MAX_VALUE, offset, UniSets.of(), reuseGroup);
+    private List<PollContext<String, String>> runPcUntilOffset(int offset, GroupOption reuseGroup) {
+        return runPcUntilOffset(DEFAULT_OFFSET_RESET_POLICY, Long.MAX_VALUE, offset, UniSets.of(), reuseGroup);
     }
 
     private static long getOffsetFromKey(String key) {
@@ -218,13 +226,15 @@ private void setupCompacted() {
     }
 
     @SneakyThrows
-    private void triggerTombStoneProcessing() {
+    private List<String> triggerTombStoneProcessing() {
         // send a lot of messages to fill up segments
         List<String> keys = produceMessages(TO_PRODUCE * 2, "log-compaction-trigger-");
         // or wait?
         final int pauseSeconds = 20;
         log.info("Pausing for {} seconds to allow for compaction", pauseSeconds);
         ThreadUtils.sleepSecondsLog(pauseSeconds);
+
+        return keys;
     }
 
     @SneakyThrows
@@ -278,6 +288,7 @@ void committedOffsetLower() {
      * @param targetStartOffset the offset to check that PC starts at
      * @param checkUpTo         the offset to run the PC until, while checking for the start offset
      */
+    @SneakyThrows
     private void runPcCheckStartIs(long targetStartOffset, long checkUpTo, GroupOption groupOption) {
         this.pc = super.getKcu().buildPc(PARTITION, groupOption);
         pc.subscribe(of(getTopic()));
@@ -290,16 +301,31 @@ private void runPcCheckStartIs(long targetStartOffset, long checkUpTo, GroupOpti
             if (thisOffset < lowest.get()) {
                 log.debug("Found lowest offset {}", thisOffset);
                 lowest.set(thisOffset);
-            } else {
+            } else if (thisOffset > highest.get()) {
                 highest.set(thisOffset);
             }
         });
 
-        Awaitility.await().untilAtomic(highest, greaterThanOrEqualTo(checkUpTo - 1));
+        //
+        AtomicLong bumpersSent = new AtomicLong();
+        Awaitility.await().untilAsserted(() -> {
+            // in case we're at the end of the topic, add some messages to make sure we get a poll response
+            getKcu().produceMessages(getTopic(), 1, "poll-bumper");
+            bumpersSent.incrementAndGet();
+
+            assertWithMessage("Highest seen offset")
+                    .that(highest.get())
+                    .isAtLeast(checkUpTo - 1);
+        });
 
         pc.close();
 
-        assertWithMessage("Offset started as").that(lowest.get()).isEqualTo(targetStartOffset);
+        var adjustExpected = switch (offsetResetStrategy) {
+            case EARLIEST -> targetStartOffset;
+            case LATEST -> targetStartOffset + 1;
+            case NONE -> throw new IllegalStateException("NONE not supported");
+        };
+        assertWithMessage("Offset started as").that(lowest.get()).isEqualTo(adjustExpected);
     }
 
     private void moveCommittedOffset(int moveToOffset) {
@@ -320,17 +346,20 @@ private void closePC() {
     }
 
 
-    private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpToOffset, long expectedProcessToOffset, Set<Long> exceptionsToSucceed) {
-        return runPcUntilOffset(succeedUpToOffset, expectedProcessToOffset, exceptionsToSucceed, GroupOption.NEW_GROUP);
+    private List<PollContext<String, String>> runPcUntilOffset(long succeedUpToOffset, long expectedProcessToOffset, Set<Long> exceptionsToSucceed) {
+        return runPcUntilOffset(DEFAULT_OFFSET_RESET_POLICY, succeedUpToOffset, expectedProcessToOffset, exceptionsToSucceed, GroupOption.NEW_GROUP);
     }
 
-    private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpToOffset, long expectedProcessToOffset, Set<Long> exceptionsToSucceed, GroupOption newGroup) {
-        log.debug("Running PC until offset {}", succeedUpToOffset);
+    @SneakyThrows
+    private List<PollContext<String, String>> runPcUntilOffset(OffsetResetStrategy offsetResetPolicy, long succeedUpToOffset, long expectedProcessToOffset, Set<Long> exceptionsToSucceed, GroupOption newGroup) {
+        log.debug("Running PC until at least offset {}", succeedUpToOffset);
         this.pc = super.getKcu().buildPc(UNORDERED, newGroup);
 
         SortedSet<PollContext<String, String>> seenOffsets = Collections.synchronizedSortedSet(new TreeSet<>(Comparator.comparingLong(PollContext::offset)));
         SortedSet<PollContext<String, String>> succeededOffsets = Collections.synchronizedSortedSet(new TreeSet<>(Comparator.comparingLong(PollContext::offset)));
+
         pc.subscribe(of(getTopic()));
+
         pc.poll(pollContext -> {
             seenOffsets.add(pollContext);
             long thisOffset = pollContext.offset();
@@ -345,17 +374,39 @@ private ArrayList<PollContext<String, String>> runPcUntilOffset(long succeedUpTo
             }
         });
 
-        Awaitility.await().untilAsserted(() -> {
-            assertThat(seenOffsets).isNotEmpty();
-            assertThat(seenOffsets.last().offset()).isGreaterThan(expectedProcessToOffset - 2);
-        });
-        log.debug("Succeeded up to: {} Consumed up to {}", succeededOffsets.last().offset(), seenOffsets.last().offset());
+        // give first poll a chance to run
+        ThreadUtils.sleepSecondsLog(1);
+
+        getKcu().produceMessages(getTopic(), 1, "poll-bumper");
+
+        if (offsetResetPolicy.equals(OffsetResetStrategy.NONE)) {
+            Awaitility.await().untilAsserted(() -> {
+                assertWithMessage("PC crashed / failed fast").that(pc.isClosedOrFailed()).isTrue();
+                assertThat(pc.getFailureCause()).hasCauseThat().hasMessageThat().contains("Error in BrokerPollSystem system");
+                var stackTrace = ExceptionUtils.getStackTrace(pc.getFailureCause());
+                Truth.assertThat(stackTrace).contains("Undefined offset with no reset policy for partitions");
+            });
+            return UniLists.of();
+        } else {
+
+            Awaitility.await()
+                    .failFast(pc::isClosedOrFailed)
+                    .untilAsserted(() -> {
+                        assertThat(seenOffsets).isNotEmpty();
+                        assertThat(seenOffsets.last().offset()).isGreaterThan(expectedProcessToOffset - 2);
+                    });
+
+            if (!succeededOffsets.isEmpty()) {
+                log.debug("Succeeded up to: {}", succeededOffsets.last().offset());
+            }
+            log.debug("Consumed up to {}", seenOffsets.last().offset());
 
-        pc.close();
+            pc.close();
 
-        var sorted = new ArrayList<>(seenOffsets);
-        Collections.sort(sorted, Comparator.comparingLong(PollContext::offset));
-        return sorted;
+            var sorted = new ArrayList<>(seenOffsets);
+            Collections.sort(sorted, Comparator.comparingLong(PollContext::offset));
+            return sorted;
+        }
     }
 
     /**
@@ -388,18 +439,30 @@ private void runPcCheckStartIs(int targetStartOffset, int checkUpTo) {
      * CG offset has disappeared - committed offset hasn't been changed, but broker gives us a bootstrap poll result
      * with a higher offset than expected. Could be caused by retention period, or compaction.
      */
-    @Test
-    void committedOffsetRemoved() {
+    @EnumSource(value = OffsetResetStrategy.class)
+    @ParameterizedTest
+    void committedOffsetRemoved(OffsetResetStrategy offsetResetPolicy) {
+        this.offsetResetStrategy = offsetResetPolicy;
         try (KafkaContainer compactingKafkaBroker = setupCompactingKafkaBroker()) {
-//            KafkaContainer compactingKafkaBroker = setupCompactingKafkaBroker();
-            log.debug("Compacting broker started {}", compactingKafkaBroker);
+            log.debug("Compacting broker started {}", compactingKafkaBroker.getBootstrapServers());
+
+            kcu = new KafkaClientUtils(compactingKafkaBroker);
+            kcu.setOffsetResetPolicy(offsetResetPolicy);
+            kcu.open();
 
             var producedCount = produceMessages(TO_PRODUCE).size();
 
             final int END_OFFSET = 50;
             groupId = getKcu().getGroupId();
-            runPcUntilOffset(END_OFFSET);
+            runPcUntilOffset(offsetResetPolicy, END_OFFSET);
+
+            //
+            if (offsetResetPolicy.equals(OffsetResetStrategy.NONE)) {
+                // test finished
+                return;
+            }
 
+            //
             closePC();
 
             final String compactedKey = "key-50";
@@ -407,17 +470,19 @@ void committedOffsetRemoved() {
             // before compaction
             checkHowManyRecordsWithKeyPresent(compactedKey, 1, TO_PRODUCE);
 
-            causeCommittedOffsetToBeRemoved(END_OFFSET);
+            final int triggerRecordsCount = causeCommittedOffsetToBeRemoved(END_OFFSET);
 
             // after compaction
             checkHowManyRecordsWithKeyPresent(compactedKey, 1, TO_PRODUCE + 2);
 
-            producedCount = producedCount + produceMessages(TO_PRODUCE).size();
-
-            final int TOTAL = TO_PRODUCE * 2;
+            producedCount = producedCount + triggerRecordsCount;
 
+            final int EXPECTED_RESET_OFFSET = switch (offsetResetPolicy) {
+                case EARLIEST -> 0;
+                case LATEST -> producedCount + 4;
+                case NONE -> -1; // will crash / fail fast
+            };
             getKcu().setGroupId(groupId);
-            final int EXPECTED_RESET_OFFSET = 0;
             runPcCheckStartIs(EXPECTED_RESET_OFFSET, producedCount);
         }
     }
@@ -426,8 +491,10 @@ private void checkHowManyRecordsWithKeyPresent(String keyToSearchFor, int expect
         log.debug("Looking for {} records with key {} up to offset {}", expectedQuantityToFind, keyToSearchFor, upToOffset);
 
         KafkaConsumer<String, String> newConsumer = kcu.createNewConsumer(GroupOption.NEW_GROUP);
-        newConsumer.subscribe(of(getTopic()));
-        newConsumer.seekToBeginning(UniSets.of());
+        newConsumer.assign(of(tp));
+        newConsumer.seekToBeginning(UniSets.of(tp));
+        long positionAfter = newConsumer.position(tp); // trigger eager seek
+        assertThat(positionAfter).isEqualTo(0);
         final List<ConsumerRecord<String, String>> records = new ArrayList<>();
         long highest = -1;
         while (highest < upToOffset - 1) {
@@ -444,13 +511,15 @@ private void checkHowManyRecordsWithKeyPresent(String keyToSearchFor, int expect
     }
 
     @SneakyThrows
-    private void causeCommittedOffsetToBeRemoved(long offset) {
+    private int causeCommittedOffsetToBeRemoved(long offset) {
         sendCompactionKeyForOffset(offset);
         sendCompactionKeyForOffset(offset + 1);
 
         checkHowManyRecordsWithKeyPresent("key-" + offset, 2, TO_PRODUCE + 2);
 
-        triggerTombStoneProcessing();
+        List<String> strings = triggerTombStoneProcessing();
+
+        return 2 + strings.size();
     }
 
     private void sendCompactionKeyForOffset(long offset) throws InterruptedException, ExecutionException, TimeoutException {
@@ -461,42 +530,4 @@ private void sendCompactionKeyForOffset(long offset) throws InterruptedException
                 .get(1, SECONDS);
     }
 
-    @Test
-    void cgOffsetsDeletedResetLatest() {
-        produceMessages(TO_PRODUCE);
-
-        final int END_OFFSET = 50;
-        runPcUntilOffset(END_OFFSET);
-
-        closePC();
-
-        causeCommittedConsumerGroupOffsetToBeDeleted();
-
-        produceMessages(TO_PRODUCE);
-
-        final int TOTAL_PRODUCED = TO_PRODUCE * 2;
-        runPcCheckStartIs(TOTAL_PRODUCED, TOTAL_PRODUCED);
-    }
-
-    @Test
-    void cgOffsetsDeletedResetEarliest() {
-        produceMessages(TO_PRODUCE);
-
-        final int END_OFFSET = 50;
-        runPcUntilOffset(END_OFFSET);
-
-        closePC();
-
-        causeCommittedConsumerGroupOffsetToBeDeleted();
-
-        produceMessages(100);
-
-        runPcCheckStartIs(0, TO_PRODUCE);
-    }
-
-    private void causeCommittedConsumerGroupOffsetToBeDeleted() {
-        throw new RuntimeException();
-    }
-
-
 }
\ No newline at end of file
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
index 329f669f9..890c788a3 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/utils/KafkaClientUtils.java
@@ -68,6 +68,9 @@ class PCVersion {
     @Getter
     private KafkaConsumer<String, String> consumer;
 
+    @Setter
+    private OffsetResetStrategy offsetResetPolicy = OffsetResetStrategy.EARLIEST;
+
     @Getter
     private KafkaProducer<String, String> producer;
 
@@ -118,9 +121,7 @@ private Properties setupConsumerProps(String groupIdToUse) {
         consumerProps.put(ConsumerConfig.ISOLATION_LEVEL_CONFIG, IsolationLevel.READ_COMMITTED.toString().toLowerCase(Locale.ROOT));
 
         // Reset
-        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, OffsetResetStrategy.EARLIEST.name().toLowerCase());
-//        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, OffsetResetStrategy.LATEST.name().toLowerCase());
-//        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, OffsetResetStrategy.NONE.name().toLowerCase());
+        consumerProps.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, offsetResetPolicy.name().toLowerCase());
 
         //
         //    consumerProps.put(ConsumerConfig.HEARTBEAT_INTERVAL_MS_CONFIG, 10);

From 3cb511722974151f7fc067ce6f6a912c4d4b17b8 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 02:09:48 +0100
Subject: [PATCH 105/131] step: attempt merge fix

---
 .../runConfigurations/truth_generate__pc_.xml  |  1 +
 .../parallelconsumer/state/PartitionState.java | 18 +++++++-----------
 .../PartitionStateCommittedOffsetTest.java     |  6 +++---
 .../state/PartitionStateTest.java              |  0
 .../state/ShardManagerTest.java                |  2 +-
 5 files changed, 12 insertions(+), 15 deletions(-)
 delete mode 100644 parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java

diff --git a/.idea/runConfigurations/truth_generate__pc_.xml b/.idea/runConfigurations/truth_generate__pc_.xml
index 319e7c21f..4b7f50341 100644
--- a/.idea/runConfigurations/truth_generate__pc_.xml
+++ b/.idea/runConfigurations/truth_generate__pc_.xml
@@ -11,6 +11,7 @@
           <option name="goals">
             <list>
               <option value="truth:generate" />
+              <option value="-e" />
             </list>
           </option>
           <option name="pomFileName" value="pom.xml" />
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index f0e18983c..c048ea1b8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -7,7 +7,6 @@
 import io.confluent.parallelconsumer.internal.BrokerPollSystem;
 import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import io.confluent.parallelconsumer.internal.PCModule;
-import io.confluent.parallelconsumer.internal.EpochAndRecordsMap;
 import io.confluent.parallelconsumer.offsets.NoEncodingPossibleException;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager;
 import lombok.Getter;
@@ -24,9 +23,7 @@
 import java.util.concurrent.ConcurrentSkipListMap;
 import java.util.stream.Collectors;
 
-import static io.confluent.csid.utils.JavaUtils.getFirst;
-import static io.confluent.csid.utils.JavaUtils.getLast;
-import static io.confluent.csid.utils.JavaUtils.toTreeSet;
+import static io.confluent.csid.utils.JavaUtils.*;
 import static io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.DefaultMaxMetadataSize;
 import static java.util.Optional.empty;
 import static java.util.Optional.of;
@@ -104,7 +101,7 @@ public class PartitionState<K, V> {
      * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
      *         storage
      */
-    private final ConcurrentSkipListMap<Long, Optional<ConsumerRecord<K, V>>> incompleteOffsets;
+    private ConcurrentSkipListMap<Long, Optional<ConsumerRecord<K, V>>> incompleteOffsets;
 
     /**
      * Marks whether any {@link WorkContainer}s have been added yet or not. Used for some initial poll analysis.
@@ -314,7 +311,7 @@ protected OffsetAndMetadata createOffsetAndMetadata() {
      */
     // visible for testing
     // todo change back to protected? and enable protected level managed truth (seems to be limited to public)
-    protected long getNextExpectedInitialPolledOffset() {
+    public long getNextExpectedInitialPolledOffset() {
         return getOffsetHighestSequentialSucceeded() + 1;
     }
 
@@ -472,7 +469,7 @@ protected void maybeTruncateOrPruneTrackedOffsets(EpochAndRecordsMap<?, ?>.Recor
         var high = getLast(records).get().offset(); // NOSONAR see #isEmpty
 
         // for the incomplete offsets within this range of poll batch
-        var incompletesWithinPolledBatch = incompleteOffsets.subSet(low, true, high, true);
+        var incompletesWithinPolledBatch = incompleteOffsets.keySet().subSet(low, true, high, true);
         var offsetsToRemoveFromTracking = new ArrayList<Long>();
         for (long incompleteOffset : incompletesWithinPolledBatch) {
             boolean offsetMissingFromPolledRecords = !polledOffsetLookup.contains(incompleteOffset);
@@ -493,8 +490,7 @@ protected void maybeTruncateOrPruneTrackedOffsets(EpochAndRecordsMap<?, ?>.Recor
                     low,
                     high
             );
-            boolean removedCheck = incompleteOffsets.removeAll(offsetsToRemoveFromTracking);
-            assert removedCheck;
+            offsetsToRemoveFromTracking.forEach(incompleteOffsets::remove);
         }
     }
 
@@ -527,8 +523,8 @@ private void maybeTruncateBelowOrAbove(long polledOffset) {
                     expectedBootstrapRecordOffset);
 
             // truncate
-            this.incompleteOffsets = incompleteOffsets.tailSet(polledOffset, true);
-            this.commitQueue = commitQueue.tailMap(polledOffset, true);
+            final NavigableSet<Long> incompletesToPrune = incompleteOffsets.keySet().headSet(polledOffset, true);
+            incompletesToPrune.forEach(incompleteOffsets::remove);
         } else if (pollBelowExpected) {
             // manual reset to lower offset detected
             log.warn("Bootstrap polled offset has been reset to an earlier offset ({}) - truncating state - all records " +
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index ef62a857d..8ee01d96c 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -59,7 +59,7 @@ class PartitionStateCommittedOffsetTest {
 
     HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(highestSeenOffset), new HashSet<>(incompletes));
 
-    PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+    PartitionState<String, String> state = new PartitionState<>(mu.getModule(), tp, offsetData);
 
     /**
      * Test for offset gaps in partition data (i.e. compacted topics)
@@ -122,7 +122,7 @@ private void addPollToState(PartitionState<String, String> state, PolledTestBatc
             var offset = wc.offset();
             final boolean notPreviouslyCompleted = !state.isRecordPreviouslyCompleted(wc.getCr());
             if (notPreviouslyCompleted) {
-                state.addNewIncompleteWorkContainer(wc);
+                state.addNewIncompleteRecord(wc.getCr());
             }
         }
     }
@@ -141,7 +141,7 @@ private void addPollToState(PartitionState<String, String> state, PolledTestBatc
     @Test
     void bootstrapPollOffsetHigherDueToRetentionOrCompaction() {
         // committed state
-        PartitionState<String, String> state = new PartitionState<>(tp, offsetData);
+        PartitionState<String, String> state = new PartitionState<>(mu.getModule(), tp, offsetData);
 
         // bootstrap poll
         PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateTest.java
deleted file mode 100644
index e69de29bb..000000000
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardManagerTest.java
index 927748175..3453dffaa 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/ShardManagerTest.java
@@ -23,7 +23,7 @@ class ShardManagerTest {
     @Test
     void retryQueueOrdering() {
         PCModuleTestEnv module = mu.getModule();
-        ShardManager<String, String> sm = new ShardManager<>(module.options(), module.workManager());
+        ShardManager<String, String> sm = new ShardManager<>(module, module.workManager());
         NavigableSet<WorkContainer<?, ?>> retryQueue = sm.getRetryQueue();
 
 

From a1cffd09ce230fba9da58c80d0971d5027747b3e Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 09:55:30 +0100
Subject: [PATCH 106/131] temp make method public for TG

---
 .../io/confluent/parallelconsumer/state/PartitionState.java     | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 01b661ddc..ec74f4522 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -329,7 +329,7 @@ protected OffsetAndMetadata createOffsetAndMetadata() {
      */
     // visible for testing
     // todo change back to protected? and enable protected level managed truth (seems to be limited to public)
-    protected long getNextExpectedInitialPolledOffset() {
+    public long getNextExpectedInitialPolledOffset() {
         return getOffsetHighestSequentialSucceeded() + 1;
     }
 

From f5b5ce25e4fee85ec8070909fef486b10794cebc Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 10:03:05 +0100
Subject: [PATCH 107/131] fix scm tag to HEAD

---
 pom.xml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pom.xml b/pom.xml
index a40d87c64..ac3efae77 100644
--- a/pom.xml
+++ b/pom.xml
@@ -55,7 +55,7 @@
         <connection>scm:git:git://github.com:confluentinc/parallel-consumer.git</connection>
         <developerConnection>scm:git:git@github.com:confluentinc/parallel-consumer.git</developerConnection>
         <url>https://github.com/confluentinc/parallel-consumer.git</url>
-        <tag>0.5.2.2</tag>
+        <tag>HEAD</tag>
     </scm>
 
     <distributionManagement>

From 80ab1924b327fa2d88f9f51d755cc6072d9c3cb5 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 10:42:32 +0100
Subject: [PATCH 108/131] validate first

---
 .../AbstractParallelEoSStreamProcessor.java   | 20 ++++++++++++-------
 1 file changed, 13 insertions(+), 7 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
index 893e8a457..3de2bac88 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/internal/AbstractParallelEoSStreamProcessor.java
@@ -244,21 +244,19 @@ protected AbstractParallelEoSStreamProcessor(ParallelConsumerOptions<K, V> newOp
     protected AbstractParallelEoSStreamProcessor(ParallelConsumerOptions<K, V> newOptions, PCModule<K, V> module) {
         Objects.requireNonNull(newOptions, "Options must be supplied");
 
+        options = newOptions;
+        this.consumer = options.getConsumer();
+
+        validateConfiguration();
+
         module.setParallelEoSStreamProcessor(this);
 
         log.info("Confluent Parallel Consumer initialise... groupId: {}, Options: {}",
                 newOptions.getConsumer().groupMetadata().groupId(),
                 newOptions);
 
-        options = newOptions;
-        options.validate();
 
         this.dynamicExtraLoadFactor = module.dynamicExtraLoadFactor();
-        this.consumer = options.getConsumer();
-
-        checkGroupIdConfigured(consumer);
-        checkNotSubscribed(consumer);
-        checkAutoCommitIsDisabled(consumer);
 
         workerThreadPool = setupWorkerPool(newOptions.getMaxConcurrency());
 
@@ -278,6 +276,14 @@ protected AbstractParallelEoSStreamProcessor(ParallelConsumerOptions<K, V> newOp
         }
     }
 
+    private void validateConfiguration() {
+        options.validate();
+
+        checkGroupIdConfigured(consumer);
+        checkNotSubscribed(consumer);
+        checkAutoCommitIsDisabled(consumer);
+    }
+
     private void checkGroupIdConfigured(final org.apache.kafka.clients.consumer.Consumer<K, V> consumer) {
         try {
             consumer.groupMetadata();

From 17d13ebfe0a695848570723aab50a9d0d2ed8aab Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 11:12:29 +0100
Subject: [PATCH 109/131] review

---
 CHANGELOG.adoc                                        |  5 +++--
 .../state/PartitionStateCommittedOffsetIT.java        | 11 +----------
 .../state/PartitionStateCommittedOffsetTest.java      |  8 ++------
 .../src/test/resources/logback-test.xml               |  2 +-
 4 files changed, 7 insertions(+), 19 deletions(-)

diff --git a/CHANGELOG.adoc b/CHANGELOG.adoc
index 5043a8334..7dec603fe 100644
--- a/CHANGELOG.adoc
+++ b/CHANGELOG.adoc
@@ -18,8 +18,9 @@ endif::[]
 
 === Fixes
 
-* fixes #409: Fixes support for compacted topics and when commit offset is reset
-** Truncate state when bootstrap polled offset higher or lower than committed and prune missing records (#425)
+* fixes #409: Adds support for compacted topics and commit offset resetting (#425)
+** Truncate the offset state when bootstrap polled offset higher or lower than committed
+** Prune missing records from the tracked incomplete offset state, when they're missing from polled batches
 
 == 0.5.2.3
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
index 0814e6a2d..3f5d91643 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/state/PartitionStateCommittedOffsetIT.java
@@ -146,22 +146,13 @@ void compactedTopic() {
                 .map(PollContext::key)
                 .collect(Collectors.toList());
 
-//        assertWithMessage("All keys should still exist")
-//                .that(offsetsFromSecondRunFromKey)
-//                .containsAtLeastElementsIn(processedOnFirstRun.stream().map(PollContext::key).collect(Collectors.toList()));
-
         //
         List<Long> offsetsFromSecond = processedOnSecondRun.stream()
                 .map(PollContext::offset)
                 .collect(Collectors.toList());
 
-//        assertWithMessage("The offsets of the tombstone targets should not be read in second run")
-//                .that(offsetsFromSecond)
-//                .containsNoneIn(tombstoneTargetOffsetsFromFirstRun);
-
         assertWithMessage("Finish reading rest of records from %s to %s",
-                UNTIL_OFFSET,
-                TO_PRODUCE)
+                UNTIL_OFFSET, TO_PRODUCE)
                 .that(processedOnSecondRun.size()).isGreaterThan(TO_PRODUCE - UNTIL_OFFSET);
 
         assertWithMessage("Off the offsets read on the second run, offsets that were compacted (below the initial produce target) should now be removed, as they were replaced with newer ones.")
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index ef62a857d..ecfe38c8f 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -24,7 +24,8 @@
 import static io.confluent.parallelconsumer.ManagedTruth.assertThat;
 
 /**
- * todo docs
+ * Unit test for PartitionState behaviour when committed offsets are changed and random records are removed (compaction)
+ * which already are tracked in the offset map.
  *
  * @author Antony Stubbs
  * @see OffsetEncodingTests#ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential
@@ -46,11 +47,6 @@ class PartitionStateCommittedOffsetTest {
 
     final long highestSeenOffset = 101L;
 
-    /**
-     * @see PartitionState#offsetHighestSucceeded
-     */
-    long highestSucceeded = highestSeenOffset;
-
     List<Long> incompletes = UniLists.of(previouslyCommittedOffset, 15L, unexpectedlyHighOffset, 60L, 80L, 95L, 96L, 97L, 98L, 100L);
 
     List<Long> expectedTruncatedIncompletes = incompletes.stream()
diff --git a/parallel-consumer-core/src/test/resources/logback-test.xml b/parallel-consumer-core/src/test/resources/logback-test.xml
index 8fce65ad1..acead0240 100644
--- a/parallel-consumer-core/src/test/resources/logback-test.xml
+++ b/parallel-consumer-core/src/test/resources/logback-test.xml
@@ -28,7 +28,7 @@
 
 
     <!-- current -->
-    <logger name="io.confluent.parallelconsumer.integrationTests.state.PartitionStateCommittedOffsetIT" level="debug"/>
+    <!--    <logger name="io.confluent.parallelconsumer.integrationTests.state.PartitionStateCommittedOffsetIT" level="debug"/>-->
 
 
     <!-- primary -->

From bd0224c11c8bee51bef874f289808a0c0eaa42ff Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 12:29:08 +0100
Subject: [PATCH 110/131] fix NPE for RemovedPartitionState setting of a null
 module

---
 .../state/PartitionState.java                 | 22 ++++++++++---------
 .../state/RemovedPartitionState.java          | 10 ++-------
 2 files changed, 14 insertions(+), 18 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index bc3d53947..38be1dfc7 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -46,16 +46,9 @@ public class PartitionState<K, V> {
      */
     public static final long KAFKA_OFFSET_ABSENCE = -1L;
 
-    private PCModule<K, V> module;
+    private final PCModule<K, V> module;
 
-    /**
-     * Used for adding work to, if it's been successfully added to our tracked state
-     *
-     * @see #maybeRegisterNewPollBatchAsWork
-     */
     @NonNull
-    private final ShardManager<K, V> sm;
-
     @Getter
     private final TopicPartition tp;
 
@@ -102,6 +95,7 @@ public class PartitionState<K, V> {
      * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
      *         storage
      */
+    @NonNull
     private ConcurrentSkipListMap<Long, Optional<ConsumerRecord<K, V>>> incompleteOffsets;
 
     /**
@@ -158,7 +152,6 @@ public class PartitionState<K, V> {
     public PartitionState(PCModule<K, V> pcModule, TopicPartition topicPartition, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.module = pcModule;
         this.tp = topicPartition;
-        this.sm = pcModule.workManager().getSm();
 
         initStateFromOffsetData(offsetData);
     }
@@ -262,13 +255,22 @@ public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.Re
             if (isRecordPreviouslyCompleted(aRecord)) {
                 log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
             } else {
-                sm.addWorkContainer(epochOfInboundRecords, aRecord);
+                getShardManager().addWorkContainer(epochOfInboundRecords, aRecord);
                 addNewIncompleteRecord(aRecord);
             }
         }
 
     }
 
+    /**
+     * Used for adding work to, if it's been successfully added to our tracked state
+     *
+     * @see #maybeRegisterNewPollBatchAsWork
+     */
+    private ShardManager<K, V> getShardManager() {
+        return module.workManager().getSm();
+    }
+
     public boolean isPartitionRemovedOrNeverAssigned() {
         return false;
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index 89cb41a75..6a1036372 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -59,13 +59,8 @@ public TopicPartition getTp() {
         return null;
     }
 
-//    @Override
-//    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
-//        // no-op
-//        log.warn("Dropping new work container for partition no longer assigned. WC: {}", wc);
-//    }
-
-    public void maybeRegisterNewRecordsAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
+    @Override
+    public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
         // no-op
         log.warn("Dropping polled record batch for partition no longer assigned. WC: {}", recordsAndEpoch);
     }
@@ -85,7 +80,6 @@ boolean isAllowedMoreRecords() {
     @Override
     public SortedSet<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         log.debug(NO_OP);
-        //noinspection unchecked - by using unsave generics, we are able to share one static instance
         return READ_ONLY_EMPTY_SET;
     }
 

From 4e0460ea3ba43f74c544a7a52d123a723259d1ad Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 12:31:38 +0100
Subject: [PATCH 111/131] Revert "fix NPE for RemovedPartitionState setting of
 a null module"

This reverts commit bd0224c11c8bee51bef874f289808a0c0eaa42ff.
---
 .../state/PartitionState.java                 | 22 +++++++++----------
 .../state/RemovedPartitionState.java          | 10 +++++++--
 2 files changed, 18 insertions(+), 14 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 38be1dfc7..bc3d53947 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -46,9 +46,16 @@ public class PartitionState<K, V> {
      */
     public static final long KAFKA_OFFSET_ABSENCE = -1L;
 
-    private final PCModule<K, V> module;
+    private PCModule<K, V> module;
 
+    /**
+     * Used for adding work to, if it's been successfully added to our tracked state
+     *
+     * @see #maybeRegisterNewPollBatchAsWork
+     */
     @NonNull
+    private final ShardManager<K, V> sm;
+
     @Getter
     private final TopicPartition tp;
 
@@ -95,7 +102,6 @@ public class PartitionState<K, V> {
      * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
      *         storage
      */
-    @NonNull
     private ConcurrentSkipListMap<Long, Optional<ConsumerRecord<K, V>>> incompleteOffsets;
 
     /**
@@ -152,6 +158,7 @@ public class PartitionState<K, V> {
     public PartitionState(PCModule<K, V> pcModule, TopicPartition topicPartition, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.module = pcModule;
         this.tp = topicPartition;
+        this.sm = pcModule.workManager().getSm();
 
         initStateFromOffsetData(offsetData);
     }
@@ -255,22 +262,13 @@ public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.Re
             if (isRecordPreviouslyCompleted(aRecord)) {
                 log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
             } else {
-                getShardManager().addWorkContainer(epochOfInboundRecords, aRecord);
+                sm.addWorkContainer(epochOfInboundRecords, aRecord);
                 addNewIncompleteRecord(aRecord);
             }
         }
 
     }
 
-    /**
-     * Used for adding work to, if it's been successfully added to our tracked state
-     *
-     * @see #maybeRegisterNewPollBatchAsWork
-     */
-    private ShardManager<K, V> getShardManager() {
-        return module.workManager().getSm();
-    }
-
     public boolean isPartitionRemovedOrNeverAssigned() {
         return false;
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index 6a1036372..89cb41a75 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -59,8 +59,13 @@ public TopicPartition getTp() {
         return null;
     }
 
-    @Override
-    public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
+//    @Override
+//    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
+//        // no-op
+//        log.warn("Dropping new work container for partition no longer assigned. WC: {}", wc);
+//    }
+
+    public void maybeRegisterNewRecordsAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
         // no-op
         log.warn("Dropping polled record batch for partition no longer assigned. WC: {}", recordsAndEpoch);
     }
@@ -80,6 +85,7 @@ boolean isAllowedMoreRecords() {
     @Override
     public SortedSet<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         log.debug(NO_OP);
+        //noinspection unchecked - by using unsave generics, we are able to share one static instance
         return READ_ONLY_EMPTY_SET;
     }
 

From 4803db96b5ae43c04960b88db06796b593144e8d Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 12:29:08 +0100
Subject: [PATCH 112/131] fix NPE for RemovedPartitionState setting of a null
 module

---
 .../state/PartitionState.java                 | 22 ++++++++++---------
 .../state/RemovedPartitionState.java          | 10 ++-------
 2 files changed, 14 insertions(+), 18 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index c048ea1b8..f721f1858 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -45,16 +45,9 @@ public class PartitionState<K, V> {
      */
     public static final long KAFKA_OFFSET_ABSENCE = -1L;
 
-    private PCModule<K, V> module;
+    private final PCModule<K, V> module;
 
-    /**
-     * Used for adding work to, if it's been successfully added to our tracked state
-     *
-     * @see #maybeRegisterNewPollBatchAsWork
-     */
     @NonNull
-    private final ShardManager<K, V> sm;
-
     @Getter
     private final TopicPartition tp;
 
@@ -101,6 +94,7 @@ public class PartitionState<K, V> {
      * @see io.confluent.parallelconsumer.offsets.BitSetEncoder for disucssion on how this is impacts per record ack
      *         storage
      */
+    @NonNull
     private ConcurrentSkipListMap<Long, Optional<ConsumerRecord<K, V>>> incompleteOffsets;
 
     /**
@@ -157,7 +151,6 @@ public class PartitionState<K, V> {
     public PartitionState(PCModule<K, V> pcModule, TopicPartition topicPartition, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.module = pcModule;
         this.tp = topicPartition;
-        this.sm = pcModule.workManager().getSm();
 
         initStateFromOffsetData(offsetData);
     }
@@ -261,13 +254,22 @@ public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.Re
             if (isRecordPreviouslyCompleted(aRecord)) {
                 log.trace("Record previously completed, skipping. offset: {}", aRecord.offset());
             } else {
-                sm.addWorkContainer(epochOfInboundRecords, aRecord);
+                getShardManager().addWorkContainer(epochOfInboundRecords, aRecord);
                 addNewIncompleteRecord(aRecord);
             }
         }
 
     }
 
+    /**
+     * Used for adding work to, if it's been successfully added to our tracked state
+     *
+     * @see #maybeRegisterNewPollBatchAsWork
+     */
+    private ShardManager<K, V> getShardManager() {
+        return module.workManager().getSm();
+    }
+
     public boolean isPartitionRemovedOrNeverAssigned() {
         return false;
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index df6ced785..93d9af14e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -57,13 +57,8 @@ public TopicPartition getTp() {
         return null;
     }
 
-//    @Override
-//    public void addNewIncompleteWorkContainer(final WorkContainer<K, V> wc) {
-//        // no-op
-//        log.warn("Dropping new work container for partition no longer assigned. WC: {}", wc);
-//    }
-
-    public void maybeRegisterNewRecordsAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
+    @Override
+    public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.RecordsAndEpoch recordsAndEpoch) {
         // no-op
         log.warn("Dropping polled record batch for partition no longer assigned. WC: {}", recordsAndEpoch);
     }
@@ -83,7 +78,6 @@ boolean isAllowedMoreRecords() {
     @Override
     public SortedSet<Long> getIncompleteOffsetsBelowHighestSucceeded() {
         log.debug(NO_OP);
-        //noinspection unchecked - by using unsave generics, we are able to share one static instance
         return READ_ONLY_EMPTY_SET;
     }
 

From 95bacaac685971ea9b9e9af52787080da4f27918 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 16:25:57 +0100
Subject: [PATCH 113/131] Implement getEpoch() and some fixes

---
 .../offsets/OffsetMapCodecManager.java        |  7 +++--
 .../state/PartitionState.java                 | 28 +++++++++++--------
 .../state/PartitionStateManager.java          |  4 ---
 .../state/RemovedPartitionState.java          |  3 +-
 .../parallelconsumer/state/WorkManager.java   |  7 -----
 .../offsets/OffsetEncodingTests.java          |  6 ++--
 .../WorkManagerOffsetMapCodecManagerTest.java |  9 +++---
 .../PartitionStateCommittedOffsetTest.java    | 18 ++----------
 .../state/WorkManagerTest.java                |  2 +-
 9 files changed, 37 insertions(+), 47 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
index af0e2f19f..e71377a29 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetMapCodecManager.java
@@ -143,7 +143,9 @@ public Map<TopicPartition, PartitionState<K, V>> loadPartitionStateForAssignment
         assignment.stream()
                 .filter(topicPartition -> !partitionStates.containsKey(topicPartition))
                 .forEach(topicPartition -> {
-                    PartitionState<K, V> defaultEntry = new PartitionState<>(module, topicPartition, HighestOffsetAndIncompletes.of());
+                    var psm = module.workManager().getPm();
+                    var epoch = psm.getEpochOfPartition(topicPartition);
+                    PartitionState<K, V> defaultEntry = new PartitionState<>(epoch, module, topicPartition, HighestOffsetAndIncompletes.of());
                     partitionStates.put(topicPartition, defaultEntry);
                 });
 
@@ -167,7 +169,8 @@ public static HighestOffsetAndIncompletes deserialiseIncompleteOffsetMapFromBase
     PartitionState<K, V> decodePartitionState(TopicPartition tp, OffsetAndMetadata offsetData) throws OffsetDecodingError {
         HighestOffsetAndIncompletes incompletes = deserialiseIncompleteOffsetMapFromBase64(offsetData);
         log.debug("Loaded incomplete offsets from offset payload {}", incompletes);
-        return new PartitionState<>(module, tp, incompletes);
+        var epoch = module.workManager().getPm().getEpochOfPartition(tp);
+        return new PartitionState<>(epoch, module, tp, incompletes);
     }
 
     public String makeOffsetMetadataPayload(long baseOffsetForPartition, PartitionState<K, V> state) throws NoEncodingPossibleException {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index 76f2ddf85..dea809016 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -148,9 +148,19 @@ public class PartitionState<K, V> {
     @Setter(PRIVATE)
     private boolean allowedMoreRecords = true;
 
-    public PartitionState(PCModule<K, V> pcModule, TopicPartition topicPartition, OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
+    /**
+     * The Epoch of the generation of partition assignment, for fencing off invalid work.
+     */
+    @Getter
+    private final long partitionsAssignmentEpoch;
+
+    public PartitionState(long newEpoch,
+                          PCModule<K, V> pcModule,
+                          TopicPartition topicPartition,
+                          OffsetMapCodecManager.HighestOffsetAndIncompletes offsetData) {
         this.module = pcModule;
         this.tp = topicPartition;
+        this.partitionsAssignmentEpoch = newEpoch;
 
         initStateFromOffsetData(offsetData);
     }
@@ -246,6 +256,9 @@ public void maybeRegisterNewPollBatchAsWork(@NonNull EpochAndRecordsMap<K, V>.Re
             return;
         }
 
+        //
+        maybeTruncateOrPruneTrackedOffsets(recordsAndEpoch);
+
         //
         long epochOfInboundRecords = recordsAndEpoch.getEpochOfPartitionAtPoll();
         List<ConsumerRecord<K, V>> recordPollBatch = recordsAndEpoch.getRecords();
@@ -273,6 +286,7 @@ public boolean isPartitionRemovedOrNeverAssigned() {
         return false;
     }
 
+    // visible for legacy testing
     public void addNewIncompleteRecord(ConsumerRecord<K, V> record) {
         long offset = record.offset();
         maybeRaiseHighestSeenOffset(offset);
@@ -311,7 +325,7 @@ private void maybeTruncateBelowOrAbove(long polledOffset) {
                     expectedBootstrapRecordOffset);
 
             // truncate
-            final NavigableSet<Long> incompletesToPrune = incompleteOffsets.keySet().headSet(polledOffset, true);
+            final NavigableSet<Long> incompletesToPrune = incompleteOffsets.keySet().headSet(polledOffset, false);
             incompletesToPrune.forEach(incompleteOffsets::remove);
         } else if (pollBelowExpected) {
             // manual reset to lower offset detected
@@ -498,7 +512,7 @@ public boolean isBlocked() {
      * Also, does {@link #maybeTruncateBelowOrAbove}.
      */
     @SuppressWarnings("OptionalGetWithoutIsPresent") // checked with isEmpty
-    protected void maybeTruncateOrPruneTrackedOffsets(EpochAndRecordsMap<?, ?>.RecordsAndEpoch polledRecordBatch) {
+    private void maybeTruncateOrPruneTrackedOffsets(EpochAndRecordsMap<?, ?>.RecordsAndEpoch polledRecordBatch) {
         var records = polledRecordBatch.getRecords();
 
         if (records.isEmpty()) {
@@ -603,13 +617,5 @@ boolean checkIfWorkIsStale(final WorkContainer<?, ?> workContainer) {
         return false;
     }
 
-    /**
-     * todo docs
-     */
-    private Long getPartitionsAssignmentEpoch() {
-        // todo teach PartitionState to know it's Epoch, move this into PartitionState
-        throw new RuntimeException();
-    }
-
 }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index 1a8831a30..a7ca2476b 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -13,7 +13,6 @@
 import lombok.Getter;
 import lombok.Setter;
 import lombok.extern.slf4j.Slf4j;
-import org.apache.kafka.clients.consumer.Consumer;
 import org.apache.kafka.clients.consumer.ConsumerRebalanceListener;
 import org.apache.kafka.clients.consumer.OffsetAndMetadata;
 import org.apache.kafka.common.TopicPartition;
@@ -47,8 +46,6 @@ public class PartitionStateManager<K, V> implements ConsumerRebalanceListener {
     // todo remove static
     private static double USED_PAYLOAD_THRESHOLD_MULTIPLIER = USED_PAYLOAD_THRESHOLD_MULTIPLIER_DEFAULT;
 
-    private final Consumer<K, V> consumer;
-
     private final ShardManager<K, V> sm;
 
     /**
@@ -70,7 +67,6 @@ public class PartitionStateManager<K, V> implements ConsumerRebalanceListener {
     private final PCModule<K, V> module;
 
     public PartitionStateManager(PCModule<K, V> module, ShardManager<K, V> sm) {
-        this.consumer = module.consumer();
         this.sm = sm;
         this.module = module;
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
index 93d9af14e..8fd3133f9 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/RemovedPartitionState.java
@@ -37,9 +37,10 @@ public class RemovedPartitionState<K, V> extends PartitionState<K, V> {
     private static final PartitionState singleton = new RemovedPartitionState<>();
 
     public static final String NO_OP = "no-op";
+    public static final int NO_EPOCH = -1;
 
     public RemovedPartitionState() {
-        super(null, null, OffsetMapCodecManager.HighestOffsetAndIncompletes.of());
+        super(NO_EPOCH, null, null, OffsetMapCodecManager.HighestOffsetAndIncompletes.of());
     }
 
     public static PartitionState getSingleton() {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
index 8e1e70857..20187c549 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/WorkManager.java
@@ -66,13 +66,6 @@ public class WorkManager<K, V> implements ConsumerRebalanceListener {
     @Getter(PUBLIC)
     private final List<Consumer<WorkContainer<K, V>>> successfulWorkListeners = new ArrayList<>();
 
-    /**
-     * Use a private {@link DynamicLoadFactor}, useful for testing.
-     */
-    public WorkManager(PCModule<K, V> module) {
-        this(module, new DynamicLoadFactor());
-    }
-
     public WorkManager(PCModule<K, V> module,
                        DynamicLoadFactor dynamicExtraLoadFactor) {
         this.options = module.options();
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
index a1f94ca67..7614140b2 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetEncodingTests.java
@@ -186,7 +186,8 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
         final ParallelConsumerOptions<String, String> newOptions = options.toBuilder().consumer(consumerSpy).build();
         final long FIRST_COMMITTED_OFFSET = 1L;
         {
-            WorkManager<String, String> wmm = new WorkManager<>(new PCModule<>(newOptions));
+            final PCModule<String, String> moduleTwo = new PCModule<>(newOptions);
+            WorkManager<String, String> wmm = moduleTwo.workManager();
             wmm.onPartitionsAssigned(UniSets.of(new TopicPartition(INPUT_TOPIC, 0)));
             wmm.registerWork(new EpochAndRecordsMap<>(testRecords, wmm.getPm()));
 
@@ -231,7 +232,8 @@ void ensureEncodingGracefullyWorksWhenOffsetsAreVeryLargeAndNotSequential(Offset
 
         // read offsets
         {
-            var newWm = new WorkManager<>(new PCModule<>(options));
+            final PCModule<String, String> moduleThree = new PCModule<>(options);
+            var newWm = moduleThree.workManager();
             newWm.onPartitionsAssigned(UniSets.of(tp));
 
             //
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
index 7f25d40fa..b3ee4dc59 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
@@ -6,7 +6,6 @@
 
 import com.google.common.truth.Truth;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
-import io.confluent.parallelconsumer.internal.PCModule;
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.state.PartitionState;
 import io.confluent.parallelconsumer.state.WorkContainer;
@@ -54,7 +53,7 @@
 @ExtendWith(MockitoExtension.class)
 class WorkManagerOffsetMapCodecManagerTest {
 
-    PCModuleTestEnv module = new PCModuleTestEnv();
+    PCModuleTestEnv module;
 
     WorkManager<String, String> wm;
 
@@ -79,7 +78,7 @@ class WorkManagerOffsetMapCodecManagerTest {
      */
     long highestSucceeded = 4;
 
-    PartitionState<String, String> state = new PartitionState<>(module, tp, new OffsetMapCodecManager.HighestOffsetAndIncompletes(of(highestSucceeded), incompleteOffsets));
+    PartitionState<String, String> state = new PartitionState<>(0, module, tp, new OffsetMapCodecManager.HighestOffsetAndIncompletes(of(highestSucceeded), incompleteOffsets));
 
     @Mock
     ConsumerRecord<String, String> mockCr;
@@ -92,6 +91,7 @@ void setupMock() {
     private void injectSucceededWorkAtOffset(long offset) {
         WorkContainer<String, String> workContainer = new WorkContainer<>(0, mockCr, mock(PCModuleTestEnv.class));
         Mockito.doReturn(offset).when(mockCr).offset();
+//        state.
         state.addNewIncompleteRecord(mockCr);
         state.onSuccess(offset); // in this case the highest seen is also the highest succeeded
     }
@@ -125,7 +125,8 @@ void setup() {
         var options = ParallelConsumerOptions.<String, String>builder()
                 .consumer(mockConsumer)
                 .build();
-        wm = new WorkManager<>(new PCModule<>(options));
+        module = new PCModuleTestEnv(options);
+        wm = module.workManager();
         wm.onPartitionsAssigned(UniLists.of(tp));
         offsetCodecManager = new OffsetMapCodecManager<>(module);
     }
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
index b7108fe9b..c93a1f00f 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/PartitionStateCommittedOffsetTest.java
@@ -53,7 +53,7 @@ class PartitionStateCommittedOffsetTest {
 
     HighestOffsetAndIncompletes offsetData = new HighestOffsetAndIncompletes(Optional.of(highestSeenOffset), new HashSet<>(incompletes));
 
-    PartitionState<String, String> state = new PartitionState<>(mu.getModule(), tp, offsetData);
+    PartitionState<String, String> state = new PartitionState<>(0, mu.getModule(), tp, offsetData);
 
     /**
      * Test for offset gaps in partition data (i.e. compacted topics)
@@ -109,16 +109,7 @@ void committedOffsetLower() {
     }
 
     private void addPollToState(PartitionState<String, String> state, PolledTestBatch polledTestBatch) {
-        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
-        state.maybeTruncateOrPruneTrackedOffsets(polledTestBatch.polledRecordBatch.records(tp));
-        for (var wc : polledTestBatch.polledBatchWCs) {
-            // todo when PSM and PartitionState are refactored, this conditional should not be needed
-            var offset = wc.offset();
-            final boolean notPreviouslyCompleted = !state.isRecordPreviouslyCompleted(wc.getCr());
-            if (notPreviouslyCompleted) {
-                state.addNewIncompleteRecord(wc.getCr());
-            }
-        }
+        state.maybeRegisterNewPollBatchAsWork(polledTestBatch.polledRecordBatch.records(state.getTp()));
     }
 
     /**
@@ -134,13 +125,10 @@ private void addPollToState(PartitionState<String, String> state, PolledTestBatc
      */
     @Test
     void bootstrapPollOffsetHigherDueToRetentionOrCompaction() {
-        // committed state
-        PartitionState<String, String> state = new PartitionState<>(mu.getModule(), tp, offsetData);
-
         // bootstrap poll
         PolledTestBatch polledTestBatch = new PolledTestBatch(mu, tp, unexpectedlyHighOffset, highestSeenOffset);
 
-        // todo when PSM and PartitionState are refactored, these two calls in PS should be a single call
+        //
         addPollToState(state, polledTestBatch);
 
         //
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
index ea26e1c3a..6bbf37e2b 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
@@ -87,7 +87,7 @@ private void setupWorkManager(ParallelConsumerOptions options) {
 
         module = new PCModuleTestEnv(optsOverride);
 
-        wm = new WorkManager<>(module);
+        wm = module.workManager();
         wm.getSuccessfulWorkListeners().add((work) -> {
             log.debug("Heard some successful work: {}", work);
             successfulWork.add(work);

From e2d512b434c43d69e4eb855559db1a151c382568 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 16:44:34 +0100
Subject: [PATCH 114/131] review

---
 .../confluent/parallelconsumer/state/PartitionState.java | 9 ++++++++-
 .../parallelconsumer/state/PartitionStateManager.java    | 3 +++
 .../offsets/WorkManagerOffsetMapCodecManagerTest.java    | 4 ----
 3 files changed, 11 insertions(+), 5 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
index dea809016..d231130c8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionState.java
@@ -150,6 +150,8 @@ public class PartitionState<K, V> {
 
     /**
      * The Epoch of the generation of partition assignment, for fencing off invalid work.
+     * <p>
+     * Will unified actor partition assignment messages, epochs may no longer be needed.
      */
     @Getter
     private final long partitionsAssignmentEpoch;
@@ -573,7 +575,12 @@ private boolean isBlockingProgress(WorkContainer<?, ?> workContainer) {
     }
 
     /**
-     * TODO docs
+     * Checks if this record be taken from its partition as work.
+     * <p>
+     * It checks that the work is not stale, and that the partition ok to allow more records to be processed, or if the
+     * record is actually blocking our progress.
+     *
+     * @return true if this record be taken from its partition as work.
      */
     public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
         if (checkIfWorkIsStale(workContainer)) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
index a7ca2476b..d8fad68fc 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/state/PartitionStateManager.java
@@ -285,6 +285,9 @@ private Map<TopicPartition, PartitionState<K, V>> getAssignedPartitions() {
                 .collect(Collectors.toMap(Map.Entry::getKey, Map.Entry::getValue)));
     }
 
+    /**
+     * @return true if this record be taken from its partition as work.
+     */
     public boolean couldBeTakenAsWork(WorkContainer<K, V> workContainer) {
         return getPartitionState(workContainer)
                 .couldBeTakenAsWork(workContainer);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
index b3ee4dc59..581d641a0 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/WorkManagerOffsetMapCodecManagerTest.java
@@ -8,7 +8,6 @@
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import io.confluent.parallelconsumer.internal.PCModuleTestEnv;
 import io.confluent.parallelconsumer.state.PartitionState;
-import io.confluent.parallelconsumer.state.WorkContainer;
 import io.confluent.parallelconsumer.state.WorkManager;
 import lombok.Getter;
 import lombok.SneakyThrows;
@@ -46,7 +45,6 @@
 import static java.nio.charset.StandardCharsets.UTF_8;
 import static java.util.Optional.of;
 import static org.assertj.core.api.Assertions.assertThat;
-import static org.mockito.Mockito.mock;
 
 // todo refactor - remove tests which use hard coded state vs dynamic state - #compressionCycle, #selialiseCycle, #runLengthEncoding, #loadCompressedRunLengthRncoding
 @Slf4j
@@ -89,9 +87,7 @@ void setupMock() {
     }
 
     private void injectSucceededWorkAtOffset(long offset) {
-        WorkContainer<String, String> workContainer = new WorkContainer<>(0, mockCr, mock(PCModuleTestEnv.class));
         Mockito.doReturn(offset).when(mockCr).offset();
-//        state.
         state.addNewIncompleteRecord(mockCr);
         state.onSuccess(offset); // in this case the highest seen is also the highest succeeded
     }

From 1406b9e213b746992d76d99c8b544f2882e694fc Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 12 Oct 2022 16:58:32 +0100
Subject: [PATCH 115/131] compiles

---
 .../parallelconsumer/offsets/ByteBufferEncoder.java         | 4 +++-
 .../parallelconsumer/offsets/OffsetSimultaneousEncoder.java | 6 +++++-
 2 files changed, 8 insertions(+), 2 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
index 36339da45..7203e6b3c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
@@ -20,7 +20,9 @@ public class ByteBufferEncoder extends OffsetEncoder {
 
     public ByteBufferEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
         super(offsetSimultaneousEncoder);
-        this.bytesBuffer = ByteBuffer.allocate(1 + length);
+        // safe cast the length to an int, as we're not expecting to have more than 2^31 offsets
+        final int safeCast = Math.toIntExact(length);
+        this.bytesBuffer = ByteBuffer.allocate(1 + safeCast);
     }
 
     @Override
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index db6a9755f..876b9ec11 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -180,7 +180,11 @@ private long getEndOffsetExclusive() {
      * Visible for testing
      */
     void addByteBufferEncoder() {
-        encoders.add(new ByteBufferEncoder(lengthBetweenBaseAndHighOffset, this));
+        try {
+            encoders.add(new ByteBufferEncoder(lengthBetweenBaseAndHighOffset, this));
+        } catch (ArithmeticException a) {
+            log.warn("Cannot use {} encoder ({})", BitSetEncoder.class.getSimpleName(), a.getMessage());
+        }
     }
 
     /**

From d276f868ea4043e454879a7d058e105776fccf83 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 12:23:15 +0100
Subject: [PATCH 116/131] fix bitset setup

---
 .../offsets/BitSetEncoder.java                 | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index d53c4540e..84b2ae5da 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -52,7 +52,7 @@ public class BitSetEncoder extends OffsetEncoder {
     public static final Integer MAX_LENGTH_ENCODABLE = Integer.MAX_VALUE;
 
     @Getter
-    private BitSet bitSet;
+    private final BitSet bitSet;
 
     private final long originalLength;
 
@@ -70,7 +70,15 @@ public BitSetEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEn
 
         this.version = newVersion;
 
+
+        if (length > MAX_LENGTH_ENCODABLE) {
+            throw new BitSetEncodingNotSupportedException("BitSet only supports " + MAX_LENGTH_ENCODABLE + " bits, but " + length + " were requested");
+        }
+
         this.originalLength = length;
+
+        // prep bit set buffer
+        bitSet = new BitSet(Math.toIntExact(length));
     }
 
     private ByteBuffer constructWrappedByteBuffer(long length, Version newVersion) throws BitSetEncodingNotSupportedException {
@@ -92,9 +100,6 @@ private ByteBuffer initV2(long bitsetEntriesRequired) throws BitSetEncodingNotSu
             throw new BitSetEncodingNotSupportedException(StringUtils.msg("BitSet V2 too long to encode, as length overflows Integer.MAX_VALUE. Length: {}. (max: {})", bitsetEntriesRequired, MAX_LENGTH_ENCODABLE));
         }
 
-        // prep bit set buffer
-        bitSet = new BitSet((int) bitsetEntriesRequired);
-
         int bytesRequiredForEntries = (int) (Math.ceil((double) bitsetEntriesRequired / Byte.SIZE));
         int lengthEntryWidth = Integer.BYTES;
         int wrappedBufferLength = lengthEntryWidth + bytesRequiredForEntries + 1;
@@ -108,8 +113,6 @@ private ByteBuffer initV2(long bitsetEntriesRequired) throws BitSetEncodingNotSu
 
     /**
      * This was a bit "short" sighted of me....
-     *
-     * @return
      */
     private ByteBuffer initV1(long bitsetEntriesRequired) throws BitSetEncodingNotSupportedException {
         if (bitsetEntriesRequired > Short.MAX_VALUE) {
@@ -117,9 +120,6 @@ private ByteBuffer initV1(long bitsetEntriesRequired) throws BitSetEncodingNotSu
             throw new BitSetEncodingNotSupportedException("Input too long to encode for BitSet V1, length overflows Short.MAX_VALUE: " + bitsetEntriesRequired + ". (max: " + Short.MAX_VALUE + ")");
         }
 
-        // prep bit set buffer
-        bitSet = new BitSet((int) bitsetEntriesRequired);
-
         int bytesRequiredForEntries = (int) (Math.ceil((double) bitsetEntriesRequired / Byte.SIZE));
         int lengthEntryWidth = Short.BYTES;
         int wrappedBufferLength = lengthEntryWidth + bytesRequiredForEntries + 1;

From 5546e2dd96349a489a9a841613a1a8404e8cdf2a Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 12:38:23 +0100
Subject: [PATCH 117/131] review, cohesion, concerns, clarity,

---
 .../offsets/OffsetSimultaneousEncoder.java     | 18 ++++++++----------
 1 file changed, 8 insertions(+), 10 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index 876b9ec11..78eb92912 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -17,6 +17,7 @@
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v1;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
+import static io.confluent.parallelconsumer.state.PartitionState.KAFKA_OFFSET_ABSENCE;
 
 /**
  * Encode with multiple strategies at the same time.
@@ -94,22 +95,19 @@ public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededO
         this.incompleteOffsets = incompleteOffsets;
 
         //
-        if (highestSucceededOffset == -1) { // nothing succeeded yet
+        if (highestSucceededOffset == KAFKA_OFFSET_ABSENCE) { // nothing succeeded yet
             highestSucceededOffset = baseOffsetToCommit;
         }
 
         highestSucceededOffset = maybeRaiseOffsetHighestSucceeded(baseOffsetToCommit, highestSucceededOffset);
 
-        long bitsetLengthL = highestSucceededOffset - this.lowWaterMark + 1;
-        if (bitsetLengthL < 0) {
-            throw new IllegalStateException(msg("Cannot have negative length BitSet (calculated length: {}, base offset to commit: {}, highest succeeded offset: {})",
-                    bitsetLengthL, baseOffsetToCommit, highestSucceededOffset));
-        }
+        lengthBetweenBaseAndHighOffset = highestSucceededOffset - this.lowWaterMark + 1;
 
-        // BitSet only support Integer.MAX_VALUE bits
-        lengthBetweenBaseAndHighOffset = (int) bitsetLengthL;
-        // sanity
-        if (bitsetLengthL != lengthBetweenBaseAndHighOffset) throw new IllegalArgumentException("Integer overflow");
+        if (lengthBetweenBaseAndHighOffset < 0) {
+            // sanity check
+            throw new IllegalStateException(msg("Cannot have negative length encoding (calculated length: {}, base offset to commit: {}, highest succeeded offset: {})",
+                    lengthBetweenBaseAndHighOffset, baseOffsetToCommit, highestSucceededOffset));
+        }
 
         this.encoders = initEncoders();
     }

From 8f0bdbbc092d64b3792edb0d6636556d1dbf6ddd Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 12:52:30 +0100
Subject: [PATCH 118/131] build(deps-dev): Fix Slf4j setup by switching away
 from and bumping Wiremock fat dependency (slf4j/logback collisions)

Upgrades Wiremock from 2.33.2 to 2.34.0
---
 parallel-consumer-core/pom.xml                                | 2 +-
 .../parallel-consumer-example-reactor/pom.xml                 | 2 +-
 .../parallel-consumer-example-vertx/pom.xml                   | 2 +-
 parallel-consumer-vertx/pom.xml                               | 2 +-
 pom.xml                                                       | 4 ++--
 5 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/parallel-consumer-core/pom.xml b/parallel-consumer-core/pom.xml
index 18bca27b6..7e9310078 100644
--- a/parallel-consumer-core/pom.xml
+++ b/parallel-consumer-core/pom.xml
@@ -90,7 +90,7 @@
         </dependency>
         <dependency>
             <groupId>com.github.tomakehurst</groupId>
-            <artifactId>wiremock</artifactId>
+            <artifactId>wiremock-jre8</artifactId>
             <scope>test</scope>
         </dependency>
         <dependency>
diff --git a/parallel-consumer-examples/parallel-consumer-example-reactor/pom.xml b/parallel-consumer-examples/parallel-consumer-example-reactor/pom.xml
index 83e8a1e08..504a94b7a 100644
--- a/parallel-consumer-examples/parallel-consumer-example-reactor/pom.xml
+++ b/parallel-consumer-examples/parallel-consumer-example-reactor/pom.xml
@@ -49,7 +49,7 @@
         </dependency>
         <dependency>
             <groupId>com.github.tomakehurst</groupId>
-            <artifactId>wiremock</artifactId>
+            <artifactId>wiremock-jre8</artifactId>
             <scope>test</scope>
         </dependency>
     </dependencies>
diff --git a/parallel-consumer-examples/parallel-consumer-example-vertx/pom.xml b/parallel-consumer-examples/parallel-consumer-example-vertx/pom.xml
index a10aa4f3d..1e1738fbc 100644
--- a/parallel-consumer-examples/parallel-consumer-example-vertx/pom.xml
+++ b/parallel-consumer-examples/parallel-consumer-example-vertx/pom.xml
@@ -49,7 +49,7 @@
         </dependency>
         <dependency>
             <groupId>com.github.tomakehurst</groupId>
-            <artifactId>wiremock</artifactId>
+            <artifactId>wiremock-jre8</artifactId>
             <scope>test</scope>
         </dependency>
     </dependencies>
diff --git a/parallel-consumer-vertx/pom.xml b/parallel-consumer-vertx/pom.xml
index 15d034be8..2d1169c9a 100644
--- a/parallel-consumer-vertx/pom.xml
+++ b/parallel-consumer-vertx/pom.xml
@@ -49,7 +49,7 @@
         </dependency>
         <dependency>
             <groupId>com.github.tomakehurst</groupId>
-            <artifactId>wiremock</artifactId>
+            <artifactId>wiremock-jre8</artifactId>
             <scope>test</scope>
         </dependency>
         <dependency>
diff --git a/pom.xml b/pom.xml
index b18b81eed..a8f8a9568 100644
--- a/pom.xml
+++ b/pom.xml
@@ -488,8 +488,8 @@
             </dependency>
             <dependency>
                 <groupId>com.github.tomakehurst</groupId>
-                <artifactId>wiremock</artifactId>
-                <version>2.33.2</version>
+                <artifactId>wiremock-jre8</artifactId>
+                <version>2.34.0</version>
                 <scope>test</scope>
             </dependency>
         </dependencies>

From e65b7b8511644ad9ce5d8932fde4301ca28f73c7 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 13:12:35 +0100
Subject: [PATCH 119/131] remove unused constructor

---
 .../io/confluent/parallelconsumer/offsets/BitSetEncoder.java  | 4 ----
 1 file changed, 4 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index 84b2ae5da..5af350954 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -58,10 +58,6 @@ public class BitSetEncoder extends OffsetEncoder {
 
     private Optional<byte[]> encodedBytes = Optional.empty();
 
-    public BitSetEncoder(int length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) throws BitSetEncodingNotSupportedException {
-        this(length, offsetSimultaneousEncoder, DEFAULT_VERSION);
-    }
-
     /**
      * @param length the difference between the highest and lowest offset to be encoded
      */

From 7eaee4f6c7ec4e7bce47126fc0e35e0b0e992a52 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 13:20:36 +0100
Subject: [PATCH 120/131] use exact casting for sanity

---
 .../io/confluent/csid/utils/MathUtils.java    | 25 +++++++++++++++++++
 .../offsets/BitSetEncoder.java                |  5 ++--
 2 files changed, 28 insertions(+), 2 deletions(-)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java
new file mode 100644
index 000000000..8f1357e7a
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java
@@ -0,0 +1,25 @@
+package io.confluent.csid.utils;
+
+import lombok.experimental.UtilityClass;
+
+/**
+ * @author Antony Stubbs
+ */
+@UtilityClass
+public class MathUtils {
+
+    /**
+     * Ensures exact conversion from a Long to a Short.
+     * <p>
+     * {@link Math} doesn't have an exact conversion from Long to Short.
+     *
+     * @see Math#toIntExact
+     */
+    public static short toShortExact(long value) {
+        final short shortCast = (short) value;
+        if (shortCast != value) {
+            throw new ArithmeticException("short overflow");
+        }
+        return shortCast;
+    }
+}
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index 5af350954..b7bca2684 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -4,6 +4,7 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.MathUtils;
 import io.confluent.csid.utils.StringUtils;
 import io.confluent.parallelconsumer.internal.InternalRuntimeException;
 import io.confluent.parallelconsumer.state.PartitionState;
@@ -102,7 +103,7 @@ private ByteBuffer initV2(long bitsetEntriesRequired) throws BitSetEncodingNotSu
         final ByteBuffer wrappedBitSetBytesBuffer = ByteBuffer.allocate(wrappedBufferLength);
 
         // bitset doesn't serialise it's set capacity, so we have to as the unused capacity actually means something
-        wrappedBitSetBytesBuffer.putInt((int) bitsetEntriesRequired);
+        wrappedBitSetBytesBuffer.putInt(Math.toIntExact(bitsetEntriesRequired));
 
         return wrappedBitSetBytesBuffer;
     }
@@ -122,7 +123,7 @@ private ByteBuffer initV1(long bitsetEntriesRequired) throws BitSetEncodingNotSu
         final ByteBuffer wrappedBitSetBytesBuffer = ByteBuffer.allocate(wrappedBufferLength);
 
         // bitset doesn't serialise it's set capacity, so we have to as the unused capacity actually means something
-        wrappedBitSetBytesBuffer.putShort((short) bitsetEntriesRequired);
+        wrappedBitSetBytesBuffer.putShort(MathUtils.toShortExact(bitsetEntriesRequired));
 
         return wrappedBitSetBytesBuffer;
     }

From 32723326c04e0a1ea1701f95f3dc3ebe3f810a56 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 14:02:23 +0100
Subject: [PATCH 121/131] Change encoding interface to long as well

---
 .../java/io/confluent/csid/utils/Range.java   | 45 +++++++++----------
 .../offsets/BitSetEncoder.java                |  7 +--
 .../offsets/ByteBufferEncoder.java            |  4 +-
 .../offsets/OffsetBitSet.java                 | 13 +++---
 .../offsets/OffsetEncoder.java                |  4 +-
 .../offsets/OffsetSimultaneousEncoder.java    | 23 +++++-----
 .../offsets/RunLengthEncoder.java             | 19 ++++----
 .../CloseAndOpenOffsetTest.java               |  2 +-
 .../LargeVolumeInMemoryTests.java             |  2 +-
 .../integrationTests/LoadTest.java            |  2 +-
 .../confluent/csid/utils/KafkaTestUtils.java  |  5 +--
 .../csid/utils/LongPollingMockConsumer.java   |  3 +-
 .../ParallelEoSStreamProcessorTest.java       |  6 +--
 .../offsets/OffsetCodecTestUtils.java         |  6 +--
 .../state/WorkManagerTest.java                |  2 +-
 15 files changed, 72 insertions(+), 71 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index e5e70cba1..0abb43d8d 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -8,13 +8,16 @@
 import java.util.Iterator;
 import java.util.List;
 import java.util.NoSuchElementException;
-import java.util.function.Consumer;
+import java.util.function.IntConsumer;
 import java.util.stream.IntStream;
+import java.util.stream.LongStream;
 
 /**
+ * Class for simple ranges.
+ * <p>
  * https://stackoverflow.com/a/16570509/105741
  */
-public class Range implements Iterable<Integer> {
+public class Range implements Iterable<Long> {
 
     private final long limit;
 
@@ -22,19 +25,12 @@ public Range(long limit) {
         this.limit = limit;
     }
 
-    /**
-     * Exclusive of max
-     */
-    public static Range range(long max) {
-        return new Range(max);
-    }
-
     @Override
-    public Iterator<Integer> iterator() {
+    public Iterator<Long> iterator() {
         final long max = limit;
-        return new Iterator<Integer>() {
+        return new Iterator<>() {
 
-            private int current = 0;
+            private long current = 0;
 
             @Override
             public boolean hasNext() {
@@ -42,7 +38,7 @@ public boolean hasNext() {
             }
 
             @Override
-            public Integer next() {
+            public Long next() {
                 if (hasNext()) {
                     return current++;
                 } else {
@@ -57,23 +53,26 @@ public void remove() {
         };
     }
 
-    public List<Integer> list() {
-        ArrayList<Integer> integers = new ArrayList<Integer>();
-        forEach(integers::add);
+    public List<Integer> listAsIntegers() {
+        ArrayList<Integer> integers = new ArrayList<>();
+        forEach(e -> integers.add(Math.toIntExact(e)));
         return integers;
     }
 
-    public IntStream toStream() {
-        return IntStream.range(0, (int) limit);
+    public LongStream toStream() {
+        return LongStream.range(0, limit);
     }
 
-    static IntStream rangeStream(int i) {
-        return IntStream.range(0, i);
+    static void range(int max, IntConsumer consumer) {
+        IntStream.range(0, max)
+                .forEach(consumer);
     }
 
-    static void range(int max, Consumer<Integer> consumer) {
-        IntStream.range(0, max)
-                .forEach(consumer::accept);
+    /**
+     * Exclusive of max
+     */
+    public static Range range(long max) {
+        return new Range(max);
     }
 
 }
\ No newline at end of file
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index b7bca2684..c4a0db29a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -145,13 +145,14 @@ protected OffsetEncoding getEncodingTypeCompressed() {
     }
 
     @Override
-    public void encodeIncompleteOffset(final int index) {
+    public void encodeIncompleteOffset(final long relativeOffset) {
         // noop - bitset defaults to 0's (`unset`)
     }
 
     @Override
-    public void encodeCompletedOffset(final int index) {
-        bitSet.set(index);
+    public void encodeCompletedOffset(final long relativeOffset) {
+        // range will already have been checked at initialization
+        bitSet.set(Math.toIntExact(relativeOffset));
     }
 
     @Override
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
index 28655cb5a..7d0fb1444 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
@@ -37,12 +37,12 @@ protected OffsetEncoding getEncodingTypeCompressed() {
     }
 
     @Override
-    public void encodeIncompleteOffset(final int rangeIndex) {
+    public void encodeIncompleteOffset(final long relativeOffset) {
         this.bytesBuffer.put((byte) 0);
     }
 
     @Override
-    public void encodeCompletedOffset(final int rangeIndex) {
+    public void encodeCompletedOffset(final long relativeOffset) {
         this.bytesBuffer.put((byte) 1);
     }
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
index cd846f139..fafc735bb 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetBitSet.java
@@ -15,9 +15,9 @@
 import static io.confluent.csid.utils.Range.range;
 
 /**
- * Deserialisation tools for {@link BitSetEncoder}.
+ * Deserialization tools for {@link BitSetEncoder}.
  * <p>
- * todo unify or refactor with {@link BitSetEncoder}. Why was it ever seperate?
+ * todo unify or refactor with {@link BitSetEncoder}. Why was it ever separate?
  *
  * @author Antony Stubbs
  * @see BitSetEncoder
@@ -41,8 +41,9 @@ static String deserialiseBitSet(int originalBitsetSize, ByteBuffer s) {
         BitSet bitSet = BitSet.valueOf(s);
 
         StringBuilder result = new StringBuilder(bitSet.size());
-        for (var offset : range(originalBitsetSize)) {
-            if (bitSet.get(offset)) {
+        for (Long offset : range(originalBitsetSize)) {
+            // range will already have been checked at initialization
+            if (bitSet.get(Math.toIntExact(offset))) {
                 result.append('x');
             } else {
                 result.append('o');
@@ -69,7 +70,9 @@ static Set<Long> deserialiseBitSetToIncompletes(long baseOffset, int originalBit
         BitSet bitSet = BitSet.valueOf(inputBuffer);
         int numberOfIncompletes = originalBitsetSize - bitSet.cardinality();
         var incompletes = new HashSet<Long>(numberOfIncompletes);
-        for (var relativeOffset : range(originalBitsetSize)) {
+        for (long relativeOffsetLong : range(originalBitsetSize)) {
+            // range will already have been checked at initialization
+            var relativeOffset = Math.toIntExact(relativeOffsetLong);
             long offset = baseOffset + relativeOffset;
             if (bitSet.get(relativeOffset)) {
                 log.trace("Ignoring completed offset {}", relativeOffset);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
index e5e4cd857..36a896305 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
@@ -28,9 +28,9 @@ protected OffsetEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
 
     protected abstract OffsetEncoding getEncodingTypeCompressed();
 
-    abstract void encodeIncompleteOffset(final int rangeIndex);
+    abstract void encodeIncompleteOffset(final long relativeOffset);
 
-    abstract void encodeCompletedOffset(final int rangeIndex);
+    abstract void encodeCompletedOffset(final long relativeOffset);
 
     abstract byte[] serialise() throws EncodingNotSupportedException;
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index 78eb92912..a5251b972 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -4,6 +4,7 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import io.confluent.parallelconsumer.state.PartitionState;
 import io.confluent.parallelconsumer.state.WorkManager;
@@ -194,7 +195,7 @@ void addByteBufferEncoder() {
      * <li>{@link OffsetEncoding#BitSet}</li>
      * <li>{@link OffsetEncoding#RunLength}</li>
      * </ul>
-     * Conditionaly encodes compression variants:
+     * Conditionally encodes compression variants:
      * <ul>
      * <li>{@link OffsetEncoding#BitSetCompressed}</li>
      * <li>{@link OffsetEncoding#RunLengthCompressed}</li>
@@ -222,20 +223,16 @@ public OffsetSimultaneousEncoder invoke() {
          *  the entire range. So when BitSet can't be used, the encoding would be potentially a lot faster as RunLength
          *  didn't need the whole loop.
          */
-        range(lengthBetweenBaseAndHighOffset).forEach(rangeIndex -> {
-            final long offset = this.lowWaterMark + rangeIndex;
-            List<OffsetEncoder> removeToBeRemoved = new ArrayList<>();
-            if (this.incompleteOffsets.contains(offset)) {
-                log.trace("Found an incomplete offset {}", offset);
-                encoders.forEach(x -> {
-                    x.encodeIncompleteOffset(rangeIndex);
-                });
+        Range relativeOffsetsLongRange = range(lengthBetweenBaseAndHighOffset);
+        relativeOffsetsLongRange.forEach(relativeOffset -> {
+            // range index (relativeOffset) is used as we don't actually encode offsets, we encode the relative offset from the base offset
+            final long actualOffset = this.lowWaterMark + relativeOffset;
+            if (this.incompleteOffsets.contains(actualOffset)) {
+                log.trace("Found an incomplete offset {}", actualOffset);
+                encoders.forEach(x -> x.encodeIncompleteOffset(relativeOffset));
             } else {
-                encoders.forEach(x -> {
-                    x.encodeCompletedOffset(rangeIndex);
-                });
+                encoders.forEach(x -> x.encodeCompletedOffset(relativeOffset));
             }
-            encoders.removeAll(removeToBeRemoved);
         });
 
         registerEncodings(encoders);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
index 396159d59..fa9b67fc8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
@@ -14,6 +14,7 @@
 
 import static io.confluent.csid.utils.StringUtils.msg;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.*;
+import static io.confluent.parallelconsumer.state.PartitionState.KAFKA_OFFSET_ABSENCE;
 
 /**
  * RunLength encoder that leverages the nature of this system.
@@ -61,13 +62,13 @@ protected OffsetEncoding getEncodingTypeCompressed() {
     }
 
     @Override
-    public void encodeIncompleteOffset(final int rangeIndex) {
-        encodeRunLength(false, rangeIndex);
+    public void encodeIncompleteOffset(final long relativeOffset) {
+        encodeRunLength(false, relativeOffset);
     }
 
     @Override
-    public void encodeCompletedOffset(final int rangeIndex) {
-        encodeRunLength(true, rangeIndex);
+    public void encodeCompletedOffset(final long relativeOffset) {
+        encodeRunLength(true, relativeOffset);
     }
 
     @Override
@@ -113,20 +114,20 @@ protected byte[] getEncodedBytes() {
         return encodedBytes.get();
     }
 
-    int previousRangeIndex = -1;
+    long previousRangeIndex = KAFKA_OFFSET_ABSENCE;
 
-    private void encodeRunLength(final boolean currentIsComplete, final int rangeIndex) {
+    private void encodeRunLength(final boolean currentIsComplete, final long relativeOffset) {
         // run length
         boolean currentOffsetMatchesOurRunLengthState = previousRunLengthState == currentIsComplete;
         if (currentOffsetMatchesOurRunLengthState) {
-            int delta = rangeIndex - previousRangeIndex;
+            long delta = relativeOffset - previousRangeIndex;
             currentRunLengthCount += delta;
         } else {
             previousRunLengthState = currentIsComplete;
             runLengthEncodingIntegers.add(currentRunLengthCount);
             currentRunLengthCount = 1; // reset to 1
         }
-        previousRangeIndex = rangeIndex;
+        previousRangeIndex = relativeOffset;
     }
 
     /**
@@ -138,7 +139,7 @@ public List<Long> calculateSucceededActualOffsets(long originalBaseOffset) {
         long offsetPosition = originalBaseOffset;
         for (final int run : runLengthEncodingIntegers) {
             if (succeeded) {
-                for (final Integer integer : Range.range(run)) {
+                for (final Long integer : Range.range(run)) {
                     long newGoodOffset = offsetPosition + integer;
                     successfulOffsets.add(newGoodOffset);
                 }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
index 87c355cfc..790908145 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/CloseAndOpenOffsetTest.java
@@ -223,7 +223,7 @@ private void send(int quantity, String topic, int partition) throws InterruptedE
         log.debug("Sending {} messages to {}", quantity, topic);
         var futures = new ArrayList<Future<RecordMetadata>>();
         // async
-        for (Integer index : Range.range(quantity)) {
+        for (Long index : Range.range(quantity)) {
             Future<RecordMetadata> send = getKcu().getProducer().send(new ProducerRecord<>(topic, partition, index.toString(), index.toString()));
             futures.add(send);
         }
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
index 9abc4cc46..3a4cb3d91 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
@@ -209,7 +209,7 @@ private void testTiming(int numberOfKeys, int quantityOfMessagesToProduce) {
         List<WorkContainer<String, String>> successfulWork = new ArrayList<>();
         super.injectWorkSuccessListener(parallelConsumer.getWm(), successfulWork);
 
-        List<Integer> keys = range(numberOfKeys).list();
+        List<Integer> keys = range(numberOfKeys).listAsIntegers();
         HashMap<Integer, List<ConsumerRecord<String, String>>> records = ktu.generateRecords(keys, quantityOfMessagesToProduce);
         ktu.send(consumerSpy, records);
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
index 4334e8acc..6ce846352 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
@@ -163,7 +163,7 @@ private void readRecordsPlainConsumer(int total, String topic) {
     private void publishMessages(int keyRange, int total, String topic) {
 
         // produce data
-        var keys = range(keyRange).list();
+        var keys = range(keyRange).listAsIntegers();
         var integers = Lists.newArrayList(IntStream.range(0, total).iterator());
 
         // publish
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
index 048351cf3..c9d4dd14e 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
@@ -25,7 +25,6 @@
 import java.util.concurrent.atomic.AtomicReference;
 import java.util.stream.Collectors;
 
-import static io.confluent.csid.utils.Range.range;
 import static java.lang.Math.random;
 import static org.assertj.core.api.Assertions.assertThat;
 
@@ -207,7 +206,7 @@ private Integer removeRandomKey(List<Integer> keyWork) {
 
     public ArrayList<ConsumerRecord<String, String>> generateRecordsForKey(Integer key, int quantity) {
         var records = new ArrayList<ConsumerRecord<String, String>>(quantity);
-        for (int i : range(quantity)) {
+        for (long i : Range.range(quantity)) {
             var rec = makeRecord(key.toString(), i + "");
             records.add(rec);
         }
@@ -224,7 +223,7 @@ public <KEY, VALUE> List<ConsumerRecord<KEY, VALUE>> flatten(Collection<List<Con
 
     @Setter
     @Getter
-    private List<Integer> defaultKeys = range(100).list();
+    private List<Integer> defaultKeys = Range.range(100).listAsIntegers();
 
     private Integer getRandomDefaultKey() {
         int i = (int) (random() * defaultKeys.size());
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
index 21264c24c..4790cceb4 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/LongPollingMockConsumer.java
@@ -21,6 +21,7 @@
 import java.util.concurrent.CopyOnWriteArrayList;
 import java.util.concurrent.atomic.AtomicBoolean;
 import java.util.stream.Collectors;
+import java.util.stream.IntStream;
 
 /**
  * Used in tests to stub out the behaviour of the real Broker and Client's long polling system (the mock Kafka Consumer
@@ -173,7 +174,7 @@ private ConsumerRebalanceListener getRebalanceListener() throws NoSuchFieldExcep
 
     public void subscribeWithRebalanceAndAssignment(final List<String> topics, int partitions) {
         List<TopicPartition> topicPartitions = topics.stream()
-                .flatMap(y -> Range.rangeStream(partitions).boxed()
+                .flatMap(y -> IntStream.range(0, partitions).boxed()
                         .map(x -> new TopicPartition(y, x)))
                 .collect(Collectors.toList());
         rebalance(topicPartitions);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
index c91d4877e..35f56bcdf 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/ParallelEoSStreamProcessorTest.java
@@ -6,6 +6,7 @@
 
 import io.confluent.csid.utils.JavaUtils;
 import io.confluent.csid.utils.LatchTestUtils;
+import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode;
 import io.confluent.parallelconsumer.internal.AbstractParallelEoSStreamProcessor;
 import lombok.SneakyThrows;
@@ -33,7 +34,6 @@
 import static io.confluent.csid.utils.KafkaUtils.toTopicPartition;
 import static io.confluent.csid.utils.LatchTestUtils.awaitLatch;
 import static io.confluent.csid.utils.LatchTestUtils.constructLatches;
-import static io.confluent.csid.utils.Range.range;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.*;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.KEY;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.UNORDERED;
@@ -490,8 +490,8 @@ public void processInKeyOrder(CommitMode commitMode) {
         var msg8Lock = new CountDownLatch(1);
 
         final var processedState = new HashMap<Integer, Boolean>();
-        for (Integer msgIndex : range(8)) {
-            processedState.put(msgIndex, false);
+        for (Long msgIndex : Range.range(8)) {
+            processedState.put(msgIndex.intValue(), false);
         }
 
         List<CountDownLatch> locks = of(msg0Lock, msg1Lock, msg2Lock, msg3Lock, msg4Lock, msg5Lock, msg6Lock, msg7Lock, msg8Lock);
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java
index 20ad9b9c5..5b57ec917 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/OffsetCodecTestUtils.java
@@ -51,10 +51,10 @@ static TreeSet<Long> bitmapStringToIncomplete(final long baseOffset, final Strin
         var incompleteOffsets = new TreeSet<Long>();
 
         final long longLength = inputBitmapString.length();
-        range(longLength).forEach(i -> {
-            var bit = inputBitmapString.charAt(i);
+        range(longLength).forEach(index -> {
+            var bit = inputBitmapString.charAt(Math.toIntExact(index));
             if (bit == 'o') {
-                incompleteOffsets.add(baseOffset + i);
+                incompleteOffsets.add(baseOffset + index);
             } else if (bit == 'x') {
                 log.trace("Dropping completed offset");
             } else {
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
index 6bbf37e2b..91a9beb79 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
@@ -570,7 +570,7 @@ void highVolumeKeyOrder(int quantity) {
 
         KafkaTestUtils ktu = new KafkaTestUtils(INPUT_TOPIC, null, new LongPollingMockConsumer<>(OffsetResetStrategy.EARLIEST));
 
-        List<Integer> keys = range(uniqueKeys).list();
+        List<Integer> keys = range(uniqueKeys).listAsIntegers();
 
         var records = ktu.generateRecords(keys, quantity);
         var flattened = ktu.flatten(records.values());

From e2a3d050169d9bb9f71db23850b600630848196a Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 14:15:10 +0100
Subject: [PATCH 122/131] review

---
 .../java/io/confluent/csid/utils/Range.java   | 32 +++++++++++--------
 1 file changed, 18 insertions(+), 14 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index 0abb43d8d..f34ddcd2e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -8,19 +8,35 @@
 import java.util.Iterator;
 import java.util.List;
 import java.util.NoSuchElementException;
-import java.util.function.IntConsumer;
 import java.util.stream.IntStream;
 import java.util.stream.LongStream;
 
 /**
  * Class for simple ranges.
  * <p>
- * https://stackoverflow.com/a/16570509/105741
+ * <a href="https://stackoverflow.com/a/16570509/105741">For loop - like Python range function</a>
+ *
+ * @see #range(long)
  */
 public class Range implements Iterable<Long> {
 
     private final long limit;
 
+    /**
+     * Provides an {@link Iterable} for the range of numbers from 0 to the given limit.
+     * <p>
+     * Exclusive of max.
+     * <p>
+     * Consider using {@link IntStream#range(int, int)#forEachOrdered} instead:
+     * <pre>
+     * IntStream.range(0, originalBitsetSize).forEachOrdered(offset -> {
+     * </pre>
+     * However, if you don't want o use a closure, this is a good alternative.
+     */
+    public static Range range(long max) {
+        return new Range(max);
+    }
+
     public Range(long limit) {
         this.limit = limit;
     }
@@ -63,16 +79,4 @@ public LongStream toStream() {
         return LongStream.range(0, limit);
     }
 
-    static void range(int max, IntConsumer consumer) {
-        IntStream.range(0, max)
-                .forEach(consumer);
-    }
-
-    /**
-     * Exclusive of max
-     */
-    public static Range range(long max) {
-        return new Range(max);
-    }
-
 }
\ No newline at end of file

From af8f11905d06c10f08a36443590c94e0670fb03e Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 14:25:53 +0100
Subject: [PATCH 123/131] review

---
 .../src/main/java/io/confluent/csid/utils/Range.java       | 7 +++++++
 .../integrationTests/LargeVolumeInMemoryTests.java         | 3 ++-
 .../parallelconsumer/integrationTests/LoadTest.java        | 4 ++--
 .../test/java/io/confluent/csid/utils/KafkaTestUtils.java  | 2 +-
 .../confluent/parallelconsumer/state/WorkManagerTest.java  | 4 ++--
 5 files changed, 14 insertions(+), 6 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index f34ddcd2e..61402a9ca 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -41,6 +41,10 @@ public Range(long limit) {
         this.limit = limit;
     }
 
+    public static List<Integer> listOfIntegers(int max) {
+        return Range.range(max).listAsIntegers();
+    }
+
     @Override
     public Iterator<Long> iterator() {
         final long max = limit;
@@ -69,6 +73,9 @@ public void remove() {
         };
     }
 
+    /**
+     * Potentially slow, but useful for tests
+     */
     public List<Integer> listAsIntegers() {
         ArrayList<Integer> integers = new ArrayList<>();
         forEach(e -> integers.add(Math.toIntExact(e)));
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
index 3a4cb3d91..2e507eb6d 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LargeVolumeInMemoryTests.java
@@ -5,6 +5,7 @@
  */
 
 import io.confluent.csid.utils.ProgressBarUtils;
+import io.confluent.csid.utils.Range;
 import io.confluent.csid.utils.ThreadUtils;
 import io.confluent.parallelconsumer.FakeRuntimeException;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
@@ -209,7 +210,7 @@ private void testTiming(int numberOfKeys, int quantityOfMessagesToProduce) {
         List<WorkContainer<String, String>> successfulWork = new ArrayList<>();
         super.injectWorkSuccessListener(parallelConsumer.getWm(), successfulWork);
 
-        List<Integer> keys = range(numberOfKeys).listAsIntegers();
+        List<Integer> keys = Range.listOfIntegers(numberOfKeys);
         HashMap<Integer, List<ConsumerRecord<String, String>>> records = ktu.generateRecords(keys, quantityOfMessagesToProduce);
         ktu.send(consumerSpy, records);
 
diff --git a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
index 6ce846352..6871317fb 100644
--- a/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
+++ b/parallel-consumer-core/src/test-integration/java/io/confluent/parallelconsumer/integrationTests/LoadTest.java
@@ -4,6 +4,7 @@
  */
 
 import io.confluent.csid.utils.ProgressBarUtils;
+import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
 import io.confluent.parallelconsumer.ParallelEoSStreamProcessor;
 import lombok.SneakyThrows;
@@ -29,7 +30,6 @@
 import java.util.stream.IntStream;
 
 import static io.confluent.csid.utils.GeneralTestUtils.time;
-import static io.confluent.csid.utils.Range.range;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.CommitMode.PERIODIC_TRANSACTIONAL_PRODUCER;
 import static java.time.Duration.ofMillis;
 import static java.time.Duration.ofSeconds;
@@ -163,7 +163,7 @@ private void readRecordsPlainConsumer(int total, String topic) {
     private void publishMessages(int keyRange, int total, String topic) {
 
         // produce data
-        var keys = range(keyRange).listAsIntegers();
+        var keys = Range.listOfIntegers(keyRange);
         var integers = Lists.newArrayList(IntStream.range(0, total).iterator());
 
         // publish
diff --git a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
index c9d4dd14e..480d610e1 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/csid/utils/KafkaTestUtils.java
@@ -223,7 +223,7 @@ public <KEY, VALUE> List<ConsumerRecord<KEY, VALUE>> flatten(Collection<List<Con
 
     @Setter
     @Getter
-    private List<Integer> defaultKeys = Range.range(100).listAsIntegers();
+    private List<Integer> defaultKeys = Range.listOfIntegers(100);
 
     private Integer getRandomDefaultKey() {
         int i = (int) (random() * defaultKeys.size());
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
index 91a9beb79..0b42893fa 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/state/WorkManagerTest.java
@@ -7,6 +7,7 @@
 import com.google.common.truth.Truth;
 import io.confluent.csid.utils.KafkaTestUtils;
 import io.confluent.csid.utils.LongPollingMockConsumer;
+import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.FakeRuntimeException;
 import io.confluent.parallelconsumer.ManagedTruth;
 import io.confluent.parallelconsumer.ParallelConsumerOptions;
@@ -41,7 +42,6 @@
 import java.util.stream.Collectors;
 
 import static com.google.common.truth.Truth.assertWithMessage;
-import static io.confluent.csid.utils.Range.range;
 import static io.confluent.parallelconsumer.ParallelConsumerOptions.ProcessingOrder.*;
 import static java.time.Duration.ofSeconds;
 import static org.assertj.core.api.Assertions.assertThat;
@@ -570,7 +570,7 @@ void highVolumeKeyOrder(int quantity) {
 
         KafkaTestUtils ktu = new KafkaTestUtils(INPUT_TOPIC, null, new LongPollingMockConsumer<>(OffsetResetStrategy.EARLIEST));
 
-        List<Integer> keys = range(uniqueKeys).listAsIntegers();
+        List<Integer> keys = Range.listOfIntegers(uniqueKeys);
 
         var records = ktu.generateRecords(keys, quantity);
         var flattened = ktu.flatten(records.values());

From 8dc65db67537348a4e6d9aca038599e6e5b1cd65 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 14:27:38 +0100
Subject: [PATCH 124/131] review

---
 .../src/main/java/io/confluent/csid/utils/Range.java           | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index 61402a9ca..ce2430f84 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -41,6 +41,9 @@ public Range(long limit) {
         this.limit = limit;
     }
 
+    /**
+     * Potentially slow, but useful for tests
+     */
     public static List<Integer> listOfIntegers(int max) {
         return Range.range(max).listAsIntegers();
     }

From 49ab1efa58dc2e1bb77d47c3fa8c3d9d308fa6e4 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 15:00:04 +0100
Subject: [PATCH 125/131] review

---
 .../io/confluent/parallelconsumer/offsets/BitSetEncoder.java    | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index c4a0db29a..c59d36efe 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -74,7 +74,7 @@ public BitSetEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEn
 
         this.originalLength = length;
 
-        // prep bit set buffer
+        // prep bit set buffer, range check above
         bitSet = new BitSet(Math.toIntExact(length));
     }
 

From bc6d592665d3d8e5810652522f25da6ccec86b22 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Fri, 21 Oct 2022 15:01:58 +0100
Subject: [PATCH 126/131] review

---
 .../src/main/java/io/confluent/csid/utils/MathUtils.java      | 4 ++++
 .../src/main/java/io/confluent/csid/utils/Range.java          | 2 +-
 2 files changed, 5 insertions(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java
index 8f1357e7a..ecb7420ae 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/MathUtils.java
@@ -1,5 +1,9 @@
 package io.confluent.csid.utils;
 
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
 import lombok.experimental.UtilityClass;
 
 /**
diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index ce2430f84..8afdb5498 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -1,7 +1,7 @@
 package io.confluent.csid.utils;
 
 /*-
- * Copyright (C) 2020-2021 Confluent, Inc.
+ * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
 import java.util.ArrayList;

From 920ec04ee607ff3858db81b876222a05b642717d Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 26 Oct 2022 12:16:25 +0100
Subject: [PATCH 127/131] Apply suggestions from code review

Co-authored-by: Roman Kolesnev <88949424+rkolesnev@users.noreply.github.com>
---
 .../src/main/java/io/confluent/csid/utils/Range.java            | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index 8afdb5498..8c5c16ec7 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -80,7 +80,7 @@ public void remove() {
      * Potentially slow, but useful for tests
      */
     public List<Integer> listAsIntegers() {
-        ArrayList<Integer> integers = new ArrayList<>();
+        List<Integer> integers = new ArrayList<>();
         forEach(e -> integers.add(Math.toIntExact(e)));
         return integers;
     }

From 9558e712436894cea5a673fbf8c86ac4d377db01 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 26 Oct 2022 13:12:08 +0100
Subject: [PATCH 128/131] step: compiles, encode steps potentially throw encode
 exception

---
 .../java/io/confluent/csid/utils/Range.java   | 12 ++--
 .../offsets/BitSetEncoder.java                | 11 ++--
 .../offsets/OffsetEncoder.java                |  4 +-
 .../offsets/OffsetSimultaneousEncoder.java    | 35 +++++++----
 .../offsets/RunLengthEncoder.java             | 50 +++++++++++-----
 ...a => RunLengthV1EncodingNotSupported.java} |  2 +-
 .../RunLengthV2EncodingNotSupported.java      | 16 +++++
 .../offsets/RunLengthEncoderTest.java         | 60 +++++++++++++++++++
 8 files changed, 147 insertions(+), 43 deletions(-)
 rename parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/{RunlengthV1EncodingNotSupported.java => RunLengthV1EncodingNotSupported.java} (81%)
 create mode 100644 parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthV2EncodingNotSupported.java

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index 8c5c16ec7..a1c8b8c12 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -4,13 +4,14 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
-import java.util.ArrayList;
 import java.util.Iterator;
 import java.util.List;
 import java.util.NoSuchElementException;
 import java.util.stream.IntStream;
 import java.util.stream.LongStream;
 
+import static java.util.stream.Collectors.toList;
+
 /**
  * Class for simple ranges.
  * <p>
@@ -76,13 +77,10 @@ public void remove() {
         };
     }
 
-    /**
-     * Potentially slow, but useful for tests
-     */
     public List<Integer> listAsIntegers() {
-        List<Integer> integers = new ArrayList<>();
-        forEach(e -> integers.add(Math.toIntExact(e)));
-        return integers;
+        return IntStream.range(0, Math.toIntExact(limit))
+                .boxed()
+                .collect(toList());
     }
 
     public LongStream toStream() {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index c59d36efe..d4e81709c 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -67,15 +67,14 @@ public BitSetEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEn
 
         this.version = newVersion;
 
-
-        if (length > MAX_LENGTH_ENCODABLE) {
-            throw new BitSetEncodingNotSupportedException("BitSet only supports " + MAX_LENGTH_ENCODABLE + " bits, but " + length + " were requested");
+        // prep bit set buffer, range check above
+        try {
+            bitSet = new BitSet(Math.toIntExact(length));
+        } catch (ArithmeticException e) {
+            throw new BitSetEncodingNotSupportedException("BitSet only supports " + MAX_LENGTH_ENCODABLE + " bits, but " + length + " were requested", e);
         }
 
         this.originalLength = length;
-
-        // prep bit set buffer, range check above
-        bitSet = new BitSet(Math.toIntExact(length));
     }
 
     private ByteBuffer constructWrappedByteBuffer(long length, Version newVersion) throws BitSetEncodingNotSupportedException {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
index 36a896305..b3e7ba3a8 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
@@ -28,9 +28,9 @@ protected OffsetEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
 
     protected abstract OffsetEncoding getEncodingTypeCompressed();
 
-    abstract void encodeIncompleteOffset(final long relativeOffset);
+    abstract void encodeIncompleteOffset(final long relativeOffset) throws EncodingNotSupportedException;
 
-    abstract void encodeCompletedOffset(final long relativeOffset);
+    abstract void encodeCompletedOffset(final long relativeOffset) throws EncodingNotSupportedException;
 
     abstract byte[] serialise() throws EncodingNotSupportedException;
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index a5251b972..24ab7c240 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -13,6 +13,7 @@
 
 import java.nio.ByteBuffer;
 import java.util.*;
+import java.util.concurrent.ConcurrentHashMap;
 
 import static io.confluent.csid.utils.Range.range;
 import static io.confluent.csid.utils.StringUtils.msg;
@@ -87,9 +88,9 @@ public class OffsetSimultaneousEncoder {
     public static final String COMPRESSION_FORCED_RESOURCE_LOCK = "Value doesn't matter, just needs a constant";
 
     /**
-     * The encoders to run
+     * The encoders to run. Concurrent so we can remove encoders while traversing.
      */
-    private final Set<OffsetEncoder> encoders;
+    private final ConcurrentHashMap.KeySetView<OffsetEncoder, Boolean> activeEncoders;
 
     public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededOffset, SortedSet<Long> incompleteOffsets) {
         this.lowWaterMark = baseOffsetToCommit;
@@ -110,7 +111,7 @@ public OffsetSimultaneousEncoder(long baseOffsetToCommit, long highestSucceededO
                     lengthBetweenBaseAndHighOffset, baseOffsetToCommit, highestSucceededOffset));
         }
 
-        this.encoders = initEncoders();
+        this.activeEncoders = initEncoders();
     }
 
     /**
@@ -142,8 +143,8 @@ private long maybeRaiseOffsetHighestSucceeded(long baseOffsetToCommit, long high
         return highestSucceededOffset;
     }
 
-    private Set<OffsetEncoder> initEncoders() {
-        var newEncoders = new HashSet<OffsetEncoder>();
+    private ConcurrentHashMap.KeySetView<OffsetEncoder, Boolean> initEncoders() {
+        ConcurrentHashMap.KeySetView<OffsetEncoder, Boolean> newEncoders = ConcurrentHashMap.newKeySet();
         if (lengthBetweenBaseAndHighOffset > LARGE_INPUT_MAP_SIZE) {
             log.trace("Relatively large input map size: {} (start: {} end: {})", lengthBetweenBaseAndHighOffset, lowWaterMark, getEndOffsetExclusive());
         }
@@ -180,7 +181,7 @@ private long getEndOffsetExclusive() {
      */
     void addByteBufferEncoder() {
         try {
-            encoders.add(new ByteBufferEncoder(lengthBetweenBaseAndHighOffset, this));
+            activeEncoders.add(new ByteBufferEncoder(lengthBetweenBaseAndHighOffset, this));
         } catch (ArithmeticException a) {
             log.warn("Cannot use {} encoder ({})", BitSetEncoder.class.getSimpleName(), a.getMessage());
         }
@@ -227,15 +228,23 @@ public OffsetSimultaneousEncoder invoke() {
         relativeOffsetsLongRange.forEach(relativeOffset -> {
             // range index (relativeOffset) is used as we don't actually encode offsets, we encode the relative offset from the base offset
             final long actualOffset = this.lowWaterMark + relativeOffset;
-            if (this.incompleteOffsets.contains(actualOffset)) {
-                log.trace("Found an incomplete offset {}", actualOffset);
-                encoders.forEach(x -> x.encodeIncompleteOffset(relativeOffset));
-            } else {
-                encoders.forEach(x -> x.encodeCompletedOffset(relativeOffset));
-            }
+            final boolean isIncomplete = this.incompleteOffsets.contains(actualOffset);
+            activeEncoders.forEach(encoder -> {
+                try {
+                    if (isIncomplete) {
+                        log.trace("Found an incomplete offset {}", actualOffset);
+                        encoder.encodeIncompleteOffset(relativeOffset);
+                    } else {
+                        encoder.encodeCompletedOffset(relativeOffset);
+                    }
+                } catch (EncodingNotSupportedException e) {
+                    log.debug("Error encoding offset {} with encoder {}, removing encoder", actualOffset, encoder.getClass().getSimpleName(), e);
+                    activeEncoders.remove(encoder);
+                }
+            });
         });
 
-        registerEncodings(encoders);
+        registerEncodings(activeEncoders);
 
         log.debug("In order: {}", this.sortedEncodings);
 
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
index fa9b67fc8..5d152304f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
@@ -4,6 +4,7 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.MathUtils;
 import io.confluent.csid.utils.Range;
 import lombok.Getter;
 
@@ -20,13 +21,16 @@
  * RunLength encoder that leverages the nature of this system.
  * <p>
  * One such nature is that gaps between completed offsets get encoded as succeeded offsets. This doesn't matter because
- * they don't exist and we'll neve see them (they no longer exist in the source partition).
+ * they don't exist, and we'll never see them (they no longer exist in the source partition).
+ * <p>
+ * Run-length is written "Run-length": https://en.wikipedia.org/wiki/Run-length_encoding
  *
  * @author Antony Stubbs
  */
 public class RunLengthEncoder extends OffsetEncoder {
 
-    private int currentRunLengthCount = 0;
+    private int currentRunLengthSize = 0;
+
     private boolean previousRunLengthState = false;
 
     @Getter
@@ -62,12 +66,12 @@ protected OffsetEncoding getEncodingTypeCompressed() {
     }
 
     @Override
-    public void encodeIncompleteOffset(final long relativeOffset) {
+    public void encodeIncompleteOffset(final long relativeOffset) throws EncodingNotSupportedException {
         encodeRunLength(false, relativeOffset);
     }
 
     @Override
-    public void encodeCompletedOffset(final long relativeOffset) {
+    public void encodeCompletedOffset(final long relativeOffset) throws EncodingNotSupportedException {
         encodeRunLength(true, relativeOffset);
     }
 
@@ -84,10 +88,11 @@ public byte[] serialise() throws EncodingNotSupportedException {
         for (final Integer runLength : runLengthEncodingIntegers) {
             switch (version) {
                 case v1 -> {
-                    final short shortCastRunlength = runLength.shortValue();
-                    if (runLength != shortCastRunlength)
-                        throw new RunlengthV1EncodingNotSupported(msg("Runlength too long for Short ({} cast to {})", runLength, shortCastRunlength));
-                    runLengthEncodedByteBuffer.putShort(shortCastRunlength);
+                    try {
+                        runLengthEncodedByteBuffer.putShort(MathUtils.toShortExact(runLength));
+                    } catch (ArithmeticException e) {
+                        throw new RunLengthV1EncodingNotSupported(msg("Run-length too long for Short ({} vs Short max of {})", runLength, Short.MAX_VALUE));
+                    }
                 }
                 case v2 -> {
                     runLengthEncodedByteBuffer.putInt(runLength);
@@ -101,7 +106,7 @@ public byte[] serialise() throws EncodingNotSupportedException {
     }
 
     void addTail() {
-        runLengthEncodingIntegers.add(currentRunLengthCount);
+        runLengthEncodingIntegers.add(currentRunLengthSize);
     }
 
     @Override
@@ -116,16 +121,33 @@ protected byte[] getEncodedBytes() {
 
     long previousRangeIndex = KAFKA_OFFSET_ABSENCE;
 
-    private void encodeRunLength(final boolean currentIsComplete, final long relativeOffset) {
+    private void encodeRunLength(final boolean currentIsComplete, final long relativeOffset) throws EncodingNotSupportedException {
         // run length
+        final long delta = relativeOffset - previousRangeIndex;
         boolean currentOffsetMatchesOurRunLengthState = previousRunLengthState == currentIsComplete;
         if (currentOffsetMatchesOurRunLengthState) {
-            long delta = relativeOffset - previousRangeIndex;
-            currentRunLengthCount += delta;
+            switch (version) {
+                case v1 -> {
+                    try {
+                        final int deltaAsInt = Math.toIntExact(delta);
+                        final int newRunLength = Math.addExact(currentRunLengthSize, deltaAsInt);
+                        currentRunLengthSize = MathUtils.toShortExact(newRunLength);
+                    } catch (ArithmeticException e) {
+                        throw new RunLengthV1EncodingNotSupported(msg("Run-length too big for Short ({} vs max of {})", currentRunLengthSize + delta, Short.MAX_VALUE));
+                    }
+                }
+                case v2 -> {
+                    try {
+                        currentRunLengthSize = Math.toIntExact(Math.addExact(currentRunLengthSize, delta));
+                    } catch (ArithmeticException e) {
+                        throw new RunLengthV2EncodingNotSupported(msg("Run-length too big for Integer ({} vs max of {})", currentRunLengthSize, Integer.MAX_VALUE));
+                    }
+                }
+            }
         } else {
             previousRunLengthState = currentIsComplete;
-            runLengthEncodingIntegers.add(currentRunLengthCount);
-            currentRunLengthCount = 1; // reset to 1
+            runLengthEncodingIntegers.add(currentRunLengthSize);
+            currentRunLengthSize = 1; // reset to 1
         }
         previousRangeIndex = relativeOffset;
     }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthV1EncodingNotSupported.java
similarity index 81%
rename from parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
rename to parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthV1EncodingNotSupported.java
index c333b7743..62cf89c25 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunlengthV1EncodingNotSupported.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthV1EncodingNotSupported.java
@@ -12,5 +12,5 @@
  * @author Antony Stubbs
  */
 @StandardException
-public class RunlengthV1EncodingNotSupported extends EncodingNotSupportedException {
+public class RunLengthV1EncodingNotSupported extends EncodingNotSupportedException {
 }
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthV2EncodingNotSupported.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthV2EncodingNotSupported.java
new file mode 100644
index 000000000..e40ea9cf9
--- /dev/null
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthV2EncodingNotSupported.java
@@ -0,0 +1,16 @@
+package io.confluent.parallelconsumer.offsets;
+
+/*-
+ * Copyright (C) 2020-2022 Confluent, Inc.
+ */
+
+import lombok.experimental.StandardException;
+
+/**
+ * Thrown when Runlength V1 encoding is not supported.
+ *
+ * @author Antony Stubbs
+ */
+@StandardException
+public class RunLengthV2EncodingNotSupported extends EncodingNotSupportedException {
+}
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
index d4727da94..35a342ef9 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
@@ -14,6 +14,7 @@
 import java.util.List;
 import java.util.Set;
 import java.util.stream.Collectors;
+import java.util.stream.LongStream;
 
 import static io.confluent.csid.utils.JavaUtils.toTreeSet;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
@@ -142,4 +143,63 @@ void gapsInOffsetsWork() {
             assertThat(calculatedCompletedOffsets).containsExactlyElementsOf(completes);
         }
     }
+
+
+    /**
+     * todo
+     */
+    @SneakyThrows
+    @Test
+    void vTwoIntegerOverflow() {
+        final long integerMaxOverflowOffset = 100;
+        final long overflowedValue = Integer.MAX_VALUE + integerMaxOverflowOffset;
+
+        var incompletes = UniSets.of(0L, 4L, 6L, 7L, 8L, 10L, overflowedValue).stream().collect(toTreeSet());
+        var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet());
+        List<Integer> runs = UniLists.of(1, 3, 1, 1, 3, 1, 1);
+        OffsetSimultaneousEncoder offsetSimultaneousEncoder
+                = new OffsetSimultaneousEncoder(-1, overflowedValue - 1, incompletes);
+
+        {
+            RunLengthEncoder rl = new RunLengthEncoder(offsetSimultaneousEncoder, v2);
+
+            rl.encodeIncompleteOffset(0); // 1
+            rl.encodeCompletedOffset(1); // 3
+            rl.encodeCompletedOffset(2);
+            rl.encodeCompletedOffset(3);
+            rl.encodeIncompleteOffset(4); // 1
+            rl.encodeCompletedOffset(5); // 1
+            rl.encodeIncompleteOffset(6); // 3
+            rl.encodeIncompleteOffset(7);
+            rl.encodeIncompleteOffset(8);
+            rl.encodeCompletedOffset(9); // 1
+            rl.encodeIncompleteOffset(10); // 1
+
+            // fill
+            // inject overflow offset
+            LongStream.range(11, overflowedValue).boxed().forEach(relativeOffset -> {
+                try {
+                    rl.encodeCompletedOffset(relativeOffset);
+                } catch (EncodingNotSupportedException e) {
+                    throw new RuntimeException(e);
+                }
+            });
+
+
+            rl.encodeIncompleteOffset(overflowedValue); // inject extremely high successful offset to cause overflow
+
+//            rl.encodeIncompleteOffset(overflowedValue + 10); // inject extremely high successful offset to cause overflow
+
+            rl.addTail();
+
+            // before serialisation
+            {
+                assertThat(rl.getRunLengthEncodingIntegers()).containsExactlyElementsOf(runs);
+
+                List<Long> calculatedCompletedOffsets = rl.calculateSucceededActualOffsets(0);
+
+                assertThat(calculatedCompletedOffsets).containsExactlyElementsOf(completes);
+            }
+        }
+    }
 }

From d7bfc797bb46a29cc6eae3d5a6a527466e01121a Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 26 Oct 2022 13:29:43 +0100
Subject: [PATCH 129/131] test update

---
 .../java/io/confluent/csid/utils/Range.java   | 29 +++++--
 .../offsets/RunLengthEncoderTest.java         | 83 ++++++++++---------
 2 files changed, 66 insertions(+), 46 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
index a1c8b8c12..4edc0bab6 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/csid/utils/Range.java
@@ -21,8 +21,23 @@
  */
 public class Range implements Iterable<Long> {
 
+    private final long start;
+
     private final long limit;
 
+    /**
+     * @see this#range(long)
+     */
+    public Range(int start, long max) {
+        this.start = start;
+        this.limit = max;
+    }
+
+    public Range(long limit) {
+        this.start = 0L;
+        this.limit = limit;
+    }
+
     /**
      * Provides an {@link Iterable} for the range of numbers from 0 to the given limit.
      * <p>
@@ -38,8 +53,11 @@ public static Range range(long max) {
         return new Range(max);
     }
 
-    public Range(long limit) {
-        this.limit = limit;
+    /**
+     * @see #range(long)
+     */
+    public static Range range(int start, long max) {
+        return new Range(start, max);
     }
 
     /**
@@ -49,12 +67,13 @@ public static List<Integer> listOfIntegers(int max) {
         return Range.range(max).listAsIntegers();
     }
 
+
     @Override
     public Iterator<Long> iterator() {
         final long max = limit;
         return new Iterator<>() {
 
-            private long current = 0;
+            private long current = start;
 
             @Override
             public boolean hasNext() {
@@ -78,13 +97,13 @@ public void remove() {
     }
 
     public List<Integer> listAsIntegers() {
-        return IntStream.range(0, Math.toIntExact(limit))
+        return IntStream.range(Math.toIntExact(start), Math.toIntExact(limit))
                 .boxed()
                 .collect(toList());
     }
 
     public LongStream toStream() {
-        return LongStream.range(0, limit);
+        return LongStream.range(start, limit);
     }
 
 }
\ No newline at end of file
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
index 35a342ef9..67a94bca3 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
@@ -4,9 +4,13 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
 import lombok.SneakyThrows;
+import org.assertj.core.api.Assertions;
 import org.junit.jupiter.api.Test;
+import org.junit.jupiter.params.ParameterizedTest;
+import org.junit.jupiter.params.provider.EnumSource;
 import pl.tlinkowski.unij.api.UniLists;
 import pl.tlinkowski.unij.api.UniSets;
 
@@ -14,7 +18,6 @@
 import java.util.List;
 import java.util.Set;
 import java.util.stream.Collectors;
-import java.util.stream.LongStream;
 
 import static io.confluent.csid.utils.JavaUtils.toTreeSet;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
@@ -146,60 +149,58 @@ void gapsInOffsetsWork() {
 
 
     /**
-     * todo
+     * Check RLv2 errors on integer overflow
      */
     @SneakyThrows
-    @Test
-    void vTwoIntegerOverflow() {
+    @ParameterizedTest()
+    @EnumSource(OffsetEncoding.Version.class)
+    void vTwoIntegerOverflow(OffsetEncoding.Version versionToTest) {
         final long integerMaxOverflowOffset = 100;
         final long overflowedValue = Integer.MAX_VALUE + integerMaxOverflowOffset;
 
         var incompletes = UniSets.of(0L, 4L, 6L, 7L, 8L, 10L, overflowedValue).stream().collect(toTreeSet());
         var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet());
-        List<Integer> runs = UniLists.of(1, 3, 1, 1, 3, 1, 1);
         OffsetSimultaneousEncoder offsetSimultaneousEncoder
                 = new OffsetSimultaneousEncoder(-1, overflowedValue - 1, incompletes);
 
         {
-            RunLengthEncoder rl = new RunLengthEncoder(offsetSimultaneousEncoder, v2);
-
-            rl.encodeIncompleteOffset(0); // 1
-            rl.encodeCompletedOffset(1); // 3
-            rl.encodeCompletedOffset(2);
-            rl.encodeCompletedOffset(3);
-            rl.encodeIncompleteOffset(4); // 1
-            rl.encodeCompletedOffset(5); // 1
-            rl.encodeIncompleteOffset(6); // 3
-            rl.encodeIncompleteOffset(7);
-            rl.encodeIncompleteOffset(8);
-            rl.encodeCompletedOffset(9); // 1
-            rl.encodeIncompleteOffset(10); // 1
-
-            // fill
-            // inject overflow offset
-            LongStream.range(11, overflowedValue).boxed().forEach(relativeOffset -> {
-                try {
-                    rl.encodeCompletedOffset(relativeOffset);
-                } catch (EncodingNotSupportedException e) {
-                    throw new RuntimeException(e);
-                }
-            });
-
-
-            rl.encodeIncompleteOffset(overflowedValue); // inject extremely high successful offset to cause overflow
-
-//            rl.encodeIncompleteOffset(overflowedValue + 10); // inject extremely high successful offset to cause overflow
-
-            rl.addTail();
-
-            // before serialisation
-            {
-                assertThat(rl.getRunLengthEncodingIntegers()).containsExactlyElementsOf(runs);
+            final OffsetEncoding.Version versionsToTest = v2;
+            testRunLength(overflowedValue, offsetSimultaneousEncoder, versionToTest);
+        }
+    }
 
-                List<Long> calculatedCompletedOffsets = rl.calculateSucceededActualOffsets(0);
+    private static void testRunLength(long overflowedValue, OffsetSimultaneousEncoder offsetSimultaneousEncoder, OffsetEncoding.Version versionsToTest) throws EncodingNotSupportedException {
+        RunLengthEncoder rl = new RunLengthEncoder(offsetSimultaneousEncoder, versionsToTest);
+
+        rl.encodeIncompleteOffset(0); // 1
+        rl.encodeCompletedOffset(1); // 3
+        rl.encodeCompletedOffset(2);
+        rl.encodeCompletedOffset(3);
+        rl.encodeIncompleteOffset(4); // 1
+        rl.encodeCompletedOffset(5); // 1
+        rl.encodeIncompleteOffset(6); // 3
+        rl.encodeIncompleteOffset(7);
+        rl.encodeIncompleteOffset(8);
+        rl.encodeCompletedOffset(9); // 1
+        rl.encodeIncompleteOffset(10); // 1
+
+        // inject overflow offset
+        var errorAssertion = Assertions.assertThatThrownBy(() -> {
+            for (var relativeOffset : Range.range(11, overflowedValue)) {
+                rl.encodeCompletedOffset(relativeOffset);
+            }
+        });
 
-                assertThat(calculatedCompletedOffsets).containsExactlyElementsOf(completes);
+        switch (versionsToTest) {
+            case v1 -> {
+                errorAssertion.isInstanceOf(RunLengthV1EncodingNotSupported.class);
+                errorAssertion.hasMessageContainingAll("too big", "Short");
+            }
+            case v2 -> {
+                errorAssertion.isInstanceOf(RunLengthV2EncodingNotSupported.class);
+                errorAssertion.hasMessageContainingAll("too big", "Integer");
             }
         }
+
     }
 }

From 0782ae911d9f792e3670b2268ca33c5d9c1e079f Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 26 Oct 2022 13:56:58 +0100
Subject: [PATCH 130/131] review, pull version up

---
 README.adoc                                   |  1 -
 .../offsets/BitSetEncoder.java                | 17 +++---
 .../offsets/ByteBufferEncoder.java            |  6 +-
 .../offsets/OffsetEncoder.java                | 13 ++++-
 .../offsets/OffsetSimultaneousEncoder.java    | 27 +++++----
 .../offsets/RunLengthEncoder.java             | 10 ++--
 .../offsets/RunLengthEncoderTest.java         | 55 +++++++++++++++++--
 7 files changed, 96 insertions(+), 33 deletions(-)

diff --git a/README.adoc b/README.adoc
index 3e3be8822..cd74ee9af 100644
--- a/README.adoc
+++ b/README.adoc
@@ -473,7 +473,6 @@ See {issues_link}/12[issue #12], and the `ParallelConsumer` JavaDoc:
 
 [source,java]
 ----
-
 /**
  * Asynchronous / concurrent message consumer for Kafka.
  * <p>
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
index d4e81709c..39bdda7e1 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/BitSetEncoder.java
@@ -9,6 +9,7 @@
 import io.confluent.parallelconsumer.internal.InternalRuntimeException;
 import io.confluent.parallelconsumer.state.PartitionState;
 import lombok.Getter;
+import lombok.ToString;
 import lombok.extern.slf4j.Slf4j;
 
 import java.nio.BufferOverflowException;
@@ -35,16 +36,15 @@
  * record should be skipped or not. So if record 8 is recorded as completed, it will be absent from the restored
  * INCOMPLETES list, and we are assured we will never see record 8.
  *
+ * @author Antony Stubbs
  * @see PartitionState#incompleteOffsets
  * @see RunLengthEncoder
  * @see OffsetBitSet
- * @author Antony Stubbs
  */
+@ToString(callSuper = true)
 @Slf4j
 public class BitSetEncoder extends OffsetEncoder {
 
-    private final Version version; // default to new version
-
     private static final Version DEFAULT_VERSION = Version.v2;
 
     /**
@@ -63,9 +63,7 @@ public class BitSetEncoder extends OffsetEncoder {
      * @param length the difference between the highest and lowest offset to be encoded
      */
     public BitSetEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) throws BitSetEncodingNotSupportedException {
-        super(offsetSimultaneousEncoder);
-
-        this.version = newVersion;
+        super(offsetSimultaneousEncoder, newVersion);
 
         // prep bit set buffer, range check above
         try {
@@ -85,9 +83,9 @@ private ByteBuffer constructWrappedByteBuffer(long length, Version newVersion) t
     }
 
     /**
-     * Switch from encoding bitset length as a short to an integer (length of 32,000 was reasonable too short).
+     * Switch from encoding bitset length as a short to an integer (Short.MAX_VALUE size of 32,000 was too short).
      * <p>
-     * Integer.MAX_VALUE should always be good enough as system restricts large from being processed at once.
+     * Integer.MAX_VALUE is the most we can use, as {@link BitSet} only supports {@link Integer#MAX_VALUE} bits.
      */
     // TODO refactor inivtV2 and V1 together, passing in the Short or Integer
     private ByteBuffer initV2(long bitsetEntriesRequired) throws BitSetEncodingNotSupportedException {
@@ -108,7 +106,8 @@ private ByteBuffer initV2(long bitsetEntriesRequired) throws BitSetEncodingNotSu
     }
 
     /**
-     * This was a bit "short" sighted of me....
+     * This was a bit "short" sighted of me.... Encodes the capacity of the bitset as a short, which is only ~32,000
+     * bits ({@link Short#MAX_VALUE}).
      */
     private ByteBuffer initV1(long bitsetEntriesRequired) throws BitSetEncodingNotSupportedException {
         if (bitsetEntriesRequired > Short.MAX_VALUE) {
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
index 7d0fb1444..5f330bcfc 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/ByteBufferEncoder.java
@@ -4,6 +4,8 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import lombok.ToString;
+
 import java.nio.ByteBuffer;
 
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.ByteArray;
@@ -15,12 +17,14 @@
  *
  * @author Antony Stubbs
  */
+@ToString(callSuper = true)
 public class ByteBufferEncoder extends OffsetEncoder {
 
     private final ByteBuffer bytesBuffer;
 
     public ByteBufferEncoder(long length, OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
-        super(offsetSimultaneousEncoder);
+        super(offsetSimultaneousEncoder, OffsetEncoding.Version.v1);
+
         // safe cast the length to an int, as we're not expecting to have more than 2^31 offsets
         final int safeCast = Math.toIntExact(length);
         this.bytesBuffer = ByteBuffer.allocate(1 + safeCast);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
index b3e7ba3a8..ccd33a30f 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetEncoder.java
@@ -5,23 +5,32 @@
  */
 
 import lombok.SneakyThrows;
+import lombok.ToString;
 import lombok.extern.slf4j.Slf4j;
 
 import java.io.IOException;
 import java.nio.ByteBuffer;
 
+
 /**
  * Base OffsetEncoder, defining the contract for encoding offset data.
  *
  * @author Antony Stubbs
  */
+@ToString
 @Slf4j
 public abstract class OffsetEncoder {
 
+    /**
+     * Implementation version of the encoding
+     */
+    protected final OffsetEncoding.Version version;
+
     private final OffsetSimultaneousEncoder offsetSimultaneousEncoder;
 
-    protected OffsetEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder) {
+    protected OffsetEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder, OffsetEncoding.Version version) {
         this.offsetSimultaneousEncoder = offsetSimultaneousEncoder;
+        this.version = version;
     }
 
     protected abstract OffsetEncoding getEncodingType();
@@ -51,7 +60,7 @@ void register() throws EncodingNotSupportedException {
     }
 
     private void register(final OffsetEncoding type, final byte[] bytes) {
-        log.debug("Registering {}, with site {}", type, bytes.length);
+        log.debug("Registering {}, with size {}", type, bytes.length);
         EncodedOffsetPair encodedPair = new EncodedOffsetPair(type, ByteBuffer.wrap(bytes));
         offsetSimultaneousEncoder.sortedEncodings.add(encodedPair);
         offsetSimultaneousEncoder.encodingMap.put(type, bytes);
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index 24ab7c240..3f1384736 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -9,6 +9,7 @@
 import io.confluent.parallelconsumer.state.PartitionState;
 import io.confluent.parallelconsumer.state.WorkManager;
 import lombok.Getter;
+import lombok.ToString;
 import lombok.extern.slf4j.Slf4j;
 
 import java.nio.ByteBuffer;
@@ -30,6 +31,7 @@
  * @see #invoke()
  */
 @Slf4j
+@ToString(onlyExplicitlyIncluded = true)
 public class OffsetSimultaneousEncoder {
 
     /**
@@ -53,11 +55,13 @@ public class OffsetSimultaneousEncoder {
     /**
      * The lowest committable offset
      */
+    @ToString.Include
     private final long lowWaterMark;
 
     /**
      * The difference between the base offset (the offset to be committed) and the highest seen offset.
      */
+    @ToString.Include
     private final long lengthBetweenBaseAndHighOffset;
 
     /**
@@ -79,6 +83,7 @@ public class OffsetSimultaneousEncoder {
      * <p>
      * Visible for testing.
      */
+    @ToString.Include
     public static boolean compressionForced = false;
 
     /**
@@ -149,17 +154,9 @@ private ConcurrentHashMap.KeySetView<OffsetEncoder, Boolean> initEncoders() {
             log.trace("Relatively large input map size: {} (start: {} end: {})", lengthBetweenBaseAndHighOffset, lowWaterMark, getEndOffsetExclusive());
         }
 
-        try {
-            newEncoders.add(new BitSetEncoder(lengthBetweenBaseAndHighOffset, this, v1));
-        } catch (BitSetEncodingNotSupportedException a) {
-            log.debug("Cannot use {} encoder ({})", BitSetEncoder.class.getSimpleName(), a.getMessage());
-        }
+        addBitsetEncoder(newEncoders, v1);
+        addBitsetEncoder(newEncoders, v2);
 
-        try {
-            newEncoders.add(new BitSetEncoder(lengthBetweenBaseAndHighOffset, this, v2));
-        } catch (BitSetEncodingNotSupportedException a) {
-            log.warn("Cannot use {} encoder ({})", BitSetEncoder.class.getSimpleName(), a.getMessage());
-        }
 
         newEncoders.add(new RunLengthEncoder(this, v1));
         newEncoders.add(new RunLengthEncoder(this, v2));
@@ -167,6 +164,14 @@ private ConcurrentHashMap.KeySetView<OffsetEncoder, Boolean> initEncoders() {
         return newEncoders;
     }
 
+    private void addBitsetEncoder(ConcurrentHashMap.KeySetView<OffsetEncoder, Boolean> newEncoders, OffsetEncoding.Version version) {
+        try {
+            newEncoders.add(new BitSetEncoder(lengthBetweenBaseAndHighOffset, this, version));
+        } catch (BitSetEncodingNotSupportedException a) {
+            log.debug("Cannot construct {} version {} : {}", BitSetEncoder.class.getSimpleName(), version, a.getMessage());
+        }
+    }
+
     /**
      * The end offset (exclusive)
      */
@@ -238,7 +243,7 @@ public OffsetSimultaneousEncoder invoke() {
                         encoder.encodeCompletedOffset(relativeOffset);
                     }
                 } catch (EncodingNotSupportedException e) {
-                    log.debug("Error encoding offset {} with encoder {}, removing encoder", actualOffset, encoder.getClass().getSimpleName(), e);
+                    log.debug("Error encoding offset {} with encoder {}, removing encoder", actualOffset, encoder, e);
                     activeEncoders.remove(encoder);
                 }
             });
diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
index 5d152304f..b5579438a 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/RunLengthEncoder.java
@@ -7,6 +7,7 @@
 import io.confluent.csid.utils.MathUtils;
 import io.confluent.csid.utils.Range;
 import lombok.Getter;
+import lombok.ToString;
 
 import java.nio.ByteBuffer;
 import java.util.ArrayList;
@@ -27,26 +28,27 @@
  *
  * @author Antony Stubbs
  */
+@ToString(callSuper = true, onlyExplicitlyIncluded = true)
 public class RunLengthEncoder extends OffsetEncoder {
 
+    @ToString.Include
     private int currentRunLengthSize = 0;
 
+    @ToString.Include
     private boolean previousRunLengthState = false;
 
+    @ToString.Include
     @Getter
     private final List<Integer> runLengthEncodingIntegers;
 
     private Optional<byte[]> encodedBytes = Optional.empty();
 
-    private final Version version; // default to new version
-
     private static final Version DEFAULT_VERSION = Version.v2;
 
     public RunLengthEncoder(OffsetSimultaneousEncoder offsetSimultaneousEncoder, Version newVersion) {
-        super(offsetSimultaneousEncoder);
+        super(offsetSimultaneousEncoder, newVersion);
         // run length setup
         runLengthEncodingIntegers = new ArrayList<>();
-        version = newVersion;
     }
 
     @Override
diff --git a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
index 67a94bca3..36251c77f 100644
--- a/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
+++ b/parallel-consumer-core/src/test/java/io/confluent/parallelconsumer/offsets/RunLengthEncoderTest.java
@@ -4,24 +4,32 @@
  * Copyright (C) 2020-2022 Confluent, Inc.
  */
 
+import com.google.common.truth.Truth;
 import io.confluent.csid.utils.Range;
 import io.confluent.parallelconsumer.offsets.OffsetMapCodecManager.HighestOffsetAndIncompletes;
 import lombok.SneakyThrows;
 import org.assertj.core.api.Assertions;
+import org.junit.jupiter.api.Assumptions;
 import org.junit.jupiter.api.Test;
 import org.junit.jupiter.params.ParameterizedTest;
 import org.junit.jupiter.params.provider.EnumSource;
 import pl.tlinkowski.unij.api.UniLists;
 import pl.tlinkowski.unij.api.UniSets;
 
+import javax.lang.model.type.TypeKind;
 import java.nio.ByteBuffer;
 import java.util.List;
+import java.util.Map;
 import java.util.Set;
 import java.util.stream.Collectors;
 
 import static io.confluent.csid.utils.JavaUtils.toTreeSet;
 import static io.confluent.parallelconsumer.offsets.OffsetEncoding.Version.v2;
+import static io.confluent.parallelconsumer.state.PartitionState.KAFKA_OFFSET_ABSENCE;
+import static javax.lang.model.type.TypeKind.INT;
+import static javax.lang.model.type.TypeKind.SHORT;
 import static org.assertj.core.api.Assertions.assertThat;
+import static org.junit.jupiter.params.provider.EnumSource.Mode.INCLUDE;
 
 class RunLengthEncoderTest {
 
@@ -35,7 +43,7 @@ void noGaps() {
         var incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(toTreeSet());
         var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet());
         List<Integer> runs = UniLists.of(1, 3, 1, 1, 3, 1, 1);
-        OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(-1, 0L, incompletes);
+        OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(KAFKA_OFFSET_ABSENCE, 0L, incompletes);
 
         {
             RunLengthEncoder rl = new RunLengthEncoder(offsetSimultaneousEncoder, v2);
@@ -76,7 +84,7 @@ void noGapsSerialisation() {
         var incompletes = UniSets.of(0, 4, 6, 7, 8, 10).stream().map(x -> (long) x).collect(toTreeSet()); // lol - DRY!
         var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet()); // lol - DRY!
         List<Integer> runs = UniLists.of(1, 3, 1, 1, 3, 1, 1);
-        OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(-1, 0L, incompletes);
+        OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(KAFKA_OFFSET_ABSENCE, 0L, incompletes);
 
         {
             RunLengthEncoder rl = new RunLengthEncoder(offsetSimultaneousEncoder, v2);
@@ -120,7 +128,7 @@ void gapsInOffsetsWork() {
         // NB: gaps between completed offsets get encoded as succeeded offsets. This doesn't matter because they don't exist and we'll neve see them.
         Set<Long> completes = UniSets.of(1, 2, 3, 4, 5, 9).stream().map(x -> (long) x).collect(Collectors.toSet());
         List<Integer> runs = UniLists.of(1, 5, 3, 1, 1);
-        OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(-1, 0L, incompletes);
+        OffsetSimultaneousEncoder offsetSimultaneousEncoder = new OffsetSimultaneousEncoder(KAFKA_OFFSET_ABSENCE, 0L, incompletes);
 
         {
             RunLengthEncoder rl = new RunLengthEncoder(offsetSimultaneousEncoder, v2);
@@ -149,7 +157,7 @@ void gapsInOffsetsWork() {
 
 
     /**
-     * Check RLv2 errors on integer overflow
+     * Check RLv2 errors on integer overflow. Integer version of this test is very slow (1.5 minutes).
      */
     @SneakyThrows
     @ParameterizedTest()
@@ -161,7 +169,7 @@ void vTwoIntegerOverflow(OffsetEncoding.Version versionToTest) {
         var incompletes = UniSets.of(0L, 4L, 6L, 7L, 8L, 10L, overflowedValue).stream().collect(toTreeSet());
         var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet());
         OffsetSimultaneousEncoder offsetSimultaneousEncoder
-                = new OffsetSimultaneousEncoder(-1, overflowedValue - 1, incompletes);
+                = new OffsetSimultaneousEncoder(KAFKA_OFFSET_ABSENCE, overflowedValue - 1, incompletes);
 
         {
             final OffsetEncoding.Version versionsToTest = v2;
@@ -201,6 +209,43 @@ private static void testRunLength(long overflowedValue, OffsetSimultaneousEncode
                 errorAssertion.hasMessageContainingAll("too big", "Integer");
             }
         }
+    }
+
+    /**
+     * Test simultaneous encoder with run-length overflow errors fail gracefully.
+     * <p>
+     * Integer version of this test is very slow (1.5 minutes).
+     */
+    @ParameterizedTest
+    @EnumSource(names = {"SHORT", "INT"}, mode = INCLUDE)
+    void testSimultaneousWithOverflowErrors(TypeKind primitiveSize) {
+        Assumptions.assumeTrue(primitiveSize == SHORT || primitiveSize == INT);
 
+        final long integerMaxOverflowOffset = 100;
+        final int maxValue = switch (primitiveSize) {
+            case SHORT -> Short.MAX_VALUE;
+            case INT -> Integer.MAX_VALUE;
+            default -> throw new IllegalStateException("Unexpected value: " + primitiveSize);
+        };
+
+        final long overflowedValue = maxValue + integerMaxOverflowOffset;
+
+        var incompletes = UniSets.of(0L, 4L, 6L, 7L, 8L, 10L, overflowedValue).stream().collect(toTreeSet());
+        var completes = UniSets.of(1, 2, 3, 5, 9).stream().map(x -> (long) x).collect(toTreeSet());
+        OffsetSimultaneousEncoder offsetSimultaneousEncoder
+                = new OffsetSimultaneousEncoder(KAFKA_OFFSET_ABSENCE, overflowedValue - 1, incompletes);
+
+        offsetSimultaneousEncoder.invoke();
+
+        final Map<OffsetEncoding, byte[]> encodingMap = offsetSimultaneousEncoder.getEncodingMap();
+
+        //
+        switch (primitiveSize) {
+            case SHORT -> Truth.assertThat(encodingMap).hasSize(2);
+            case INT -> Truth.assertThat(encodingMap).hasSize(0);
+            default -> throw new IllegalStateException("Unexpected value: " + primitiveSize);
+        }
+        ;
     }
+
 }

From e8e0d4054f6f158e81fe9d5449c393d57fa8d479 Mon Sep 17 00:00:00 2001
From: Antony Stubbs <antony.stubbs@gmail.com>
Date: Wed, 26 Oct 2022 14:32:16 +0100
Subject: [PATCH 131/131] review

---
 .../parallelconsumer/offsets/OffsetSimultaneousEncoder.java | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
index 3f1384736..fa173bb7e 100644
--- a/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
+++ b/parallel-consumer-core/src/main/java/io/confluent/parallelconsumer/offsets/OffsetSimultaneousEncoder.java
@@ -212,10 +212,10 @@ void addByteBufferEncoder() {
      * TODO: optimisation - inline this into the partition iteration loop in {@link WorkManager}
      * <p>
      * TODO: optimisation - could double the run-length range from Short.MAX_VALUE (~33,000) to Short.MAX_VALUE * 2
-     *  (~66,000) by using unsigned shorts instead (higest representable relative offset is Short.MAX_VALUE because each
-     *  runlength entry is a Short)
+     *  (~66,000) by using unsigned shorts instead (highest representable relative offset is Short.MAX_VALUE because each
+     *  run-length entry is a Short)
      * <p>
-     *  TODO VERY large offests ranges are slow (Integer.MAX_VALUE) - encoding scans could be avoided if passing in map of incompletes which should already be known
+     *  TODO VERY large offset ranges is slow (Integer.MAX_VALUE) - encoding scans could be avoided if passing in map of incompletes which should already be known
      */
     public OffsetSimultaneousEncoder invoke() {
         log.debug("Starting encode of incompletes, base offset is: {}, end offset is: {}", lowWaterMark, getEndOffsetExclusive());