Messages loss when full local queue ? #341

erms77 · 2018-03-24T18:03:23Z

Description

When we try to write 1000000 messages in a Kafka cluster, we do not find the expected account as a result. We have 999989 messages.
Do you have an idea ?

How to reproduce

import confluent_kafka
import time
import sys

producer_timings = {}
consumer_timings = {}


def error_cb(kafka_error):
        print("ERR", kafka_error.name(), kafka_error.str(), file=sys.stderr)


def delivery_cb(err, msg):
    if err:
        print('message failed:', err, file=sys.stderr)


def calculate_thoughput(timing, n_messages=1000000, msg_size=100):
    print("Processed {0} messsages in {1:.2f} seconds".format(n_messages, timing))
    print("{0:.2f} MB/s".format((msg_size * n_messages) / timing / (1024*1024)))
    print("{0:.2f} Msgs/s".format(n_messages / timing))


def confluent_kafka_producer_performance():
    msg_count = 1000000
    msg_size = 100
    msg_payload = ('kafkatest' * 20).encode()[:msg_size]
    topic = "confluent-kafka-topic"

    prod_config = {
        "error_cb": error_cb,
        "on_delivery": delivery_cb,
        "bootstrap.servers": "192.168.254.33:9092,192.168.254.84:9092,192.168.254.69:9092",
        "group.id": "python_inector",
        "retry.backoff.ms": 3000,
        "retries": 5,
        "default.topic.config": {"request.required.acks": "all"},
        "max.in.flight.requests.per.connection": 1,
        "queue.buffering.max.messages": 100000,
        "batch.num.messages": 100,
        "message.max.bytes": 2000000
    }

    producer = confluent_kafka.Producer(**prod_config)

    producer_start = time.time()

    for i in range(msg_count):
        try:
            producer.produce(topic, value=msg_payload)
            producer.poll(0)
        except BufferError as e:
            print(e, file=sys.stderr)
            time.sleep(1)
            producer.poll(0)

    producer.flush()

    return time.time() - producer_start


producer_timings["confluent_kafka_producer"] = confluent_kafka_producer_performance()
calculate_thoughput(producer_timings["confluent_kafka_producer"])

Checklist

Please provide the following information:

confluent-kafka-python and librdkafka version
confluent_kafka.version() : ('0.11.0', 720896)
confluent_kafka.libversion() : ('0.11.4-RC2', 722175)
Apache Kafka broker version:
0.11.0
Client configuration: { 'error_cb': error_cb, 'on_delivery': delivery_cb, 'bootstrap.servers': '192.168.254.33:9092,192.168.254.84:9092,192.168.254.69:9092', 'group.id': 'python_inector', 'retry.backoff.ms': 3000, 'retries': 5, 'default.topic.config': {'request.required.acks': 'all'}, 'max.in.flight.requests.per.connection': 1, 'queue.buffering.max.messages': 100000, 'batch.num.messages': 100, 'message.max.bytes': 2000000 }
Operating system : Debian GNU/Linux 9.4 (stretch)
Provide client logs (with 'debug': '..' as necessary)
Provide broker log excerpts
Critical issue

The text was updated successfully, but these errors were encountered:

edenhill · 2018-03-26T07:09:16Z

The problem is with your producer loop:

for i in range(msg_count):
    try:
        producer.produce(topic, value=msg_payload)
        producer.poll(0)
    except BufferError as e:
        print(e, file=sys.stderr)
        time.sleep(1)
        producer.poll(0)

When you get a BufferError you back off and wait, but you don't retry the failed message.
Also, I suggest you remove time.sleep() and call producer.poll(1) instead, that'll make it quicker.

so something like this;

    for i in range(msg_count):
       while True:
            try:
                producer.produce(topic, value=msg_payload)
                producer.poll(0)
                break
            except BufferError as e:
                print(e, file=sys.stderr)
                producer.poll(1)

erms77 · 2018-03-28T17:06:09Z

It works better :)
Thank you

datta90 · 2018-04-30T08:00:40Z

i solved it by increasing the file descriptors of the user kafka in ubuntu
i am runnig kafka from the user kafka I created
this properties are given kafka documentation requirements for production env
i entered this in /etc/security/limits.conf
kafka soft nofile 128000
kafka hard nofile 128000
kafka soft nproc 65536
kafka hard nproc 65536
kafka soft memlock unlimited
kakfa hard memlock unlimited

saurabh1920 · 2021-10-13T12:03:13Z

Hi @edenhill,
In producer config, default value for message.timeout.ms is 300000. After this time, producer queue should automatically get cleared, I believe so. Please correct me if I am wrong.

PratikshaPanpaliya · 2022-05-17T06:29:06Z

@edenhill what is your producer configuration

edenhill added the usage Incorrect usage label May 14, 2018

edenhill closed this as completed May 14, 2018

TomGoBravo mentioned this issue Apr 5, 2020

BufferError: Local: Queue Full #781

Open

saurabh1920 mentioned this issue Oct 18, 2021

Producer queue not getting emptied #1224

Closed

moritzmeister mentioned this issue Jun 14, 2022

Handle BufferErrors by backing off and retrying logicalclocks/feature-store-api#673

Merged

chuck-confluent mentioned this issue Jul 15, 2022

Suggested Enhancements to Python Producer confluentinc/examples#1106

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Messages loss when full local queue ? #341

Messages loss when full local queue ? #341

erms77 commented Mar 24, 2018 •

edited by edenhill

Loading

edenhill commented Mar 26, 2018

erms77 commented Mar 28, 2018

datta90 commented Apr 30, 2018

saurabh1920 commented Oct 13, 2021 •

edited

Loading

PratikshaPanpaliya commented May 17, 2022

Messages loss when full local queue ? #341

Messages loss when full local queue ? #341

Comments

erms77 commented Mar 24, 2018 • edited by edenhill Loading

Description

How to reproduce

Checklist

edenhill commented Mar 26, 2018

erms77 commented Mar 28, 2018

datta90 commented Apr 30, 2018

saurabh1920 commented Oct 13, 2021 • edited Loading

PratikshaPanpaliya commented May 17, 2022

erms77 commented Mar 24, 2018 •

edited by edenhill

Loading

saurabh1920 commented Oct 13, 2021 •

edited

Loading