[OpenStack-ru] AMQP server is unreachable / AMQP server closed the connection. Check login credentials

Nikita Burtsev nikita.burtsev на gmail.com
Чт Мар 24 14:40:45 UTC 2016


Да в целом можно попробовать heartbeat_timeout_threshold  поднять,
kombu_reconnect_delay
уже нагуглили.

 А еще можно посмотреть на логи сервиса любого и rabbitmq в одно и тоже
время при возникновении ошибки? Желательно в совсем DEBUG.

2016-03-24 16:32 GMT+03:00 Yura Poltoratskiy <yurapoltora at gmail.com>:

> В сети управления есть контейнер с dnsmasq, все узлы без проблем видят
> друг друга, например:
>
> root at compute01:~# host rabbitmq01
> rabbitmq01 has address 10.1.1.41
>
> root at compute01:~# ping -c 1 rabbitmq01
> PING rabbitmq01 (10.1.1.41) 56(84) bytes of data.
> 64 bytes from rabbitmq01 (10.1.1.41): icmp_seq=1 ttl=64 time=0.340 ms
>
> Но я, предполагая, что проблема может быть в этом, временно менял всем в
> конфиге rabbit_host = 10.1.1.41, и даже заставлял rabbitmq-server слушать
> не loopback, а именно этот адрес:
> root at rabbitmq01:~# netstat -na | grep -w LISTEN | grep 5672
> tcp        0      0 10.1.1.41:5672          0.0.0.0:*               LISTEN
>
> Так же возникала мысль про разбежность времени - всем установил ntp,
> правда за временем "хожу" на стандартные сервера Ubuntu
> х.ubuntu.pool.ntp.org <http://xn--u1a.ubuntu.pool.ntp.org>.
>
> Все сервер включены в cisco 2960, ничего другого не включено. На физику не
> похоже - отвал rabbit'а переодический и не на одном сервере.
>
> Сейчас в конфиге так:
> [oslo_messaging_rabbit]
> rabbit_hosts=rabbitmq01:5672,rabbitmq02:5672,rabbitmq03:5672
> rabbit_userid = openstack
> rabbit_password = openstack
> rabbit_retry_interval=1
> rabbit_retry_backoff=2
> rabbit_max_retries=0
> rabbit_durable_queues=false
> rabbit_ha_queues=true
> heartbeat_rate = 2
> heartbeat_timeout_threshold = 20
> rpc_conn_pool_size = 100
> kombu_reconnect_delay=3.0
>
> Другие таймауты не трогал, не подскажите какие можно "покрутить"?
>
> Я даже специально строил rabbitmq на отдельном сервер, чтоб исключить
> проблемы и/или ограничения lxc.
>
> 24 марта 2016 г., 15:09 пользователь Nikita Burtsev <
> nikita.burtsev at gmail.com> написал:
>
> А с name resolution у вас все хорошо? И время на компонентах не
>> разбежалось в разные стороны?
>> Вообще может быть сети не очень хорошо или машинам на которых запущены
>> компоненты не хватает ресурсов? Не пробовали таймауты поднять?
>>
>> 2016-03-24 15:51 GMT+03:00 Yura Poltoratskiy <yurapoltora at gmail.com>:
>>
>>> Пароль и пользователя проверял и много раз. Более того, я сворачивал все
>>> контейнеры c rabbitmq, брал отдельный сервер и без HA построил отдельный
>>> сервер очередей - ничего не изменилось.
>>>
>>> К тому же, на правильность пароля указывают, строки виду:
>>>
>>> 2016-03-24 07:46:20.965 11111 INFO oslo.messaging._drivers.impl_rabbit
>>> [-] Reconnected to AMQP server on rabbitmq01:5672
>>> 2016-03-24 07:46:20.966 11111 INFO oslo.messaging._drivers.impl_rabbit
>>> [req-8e5b0e51-ed48-48cf-9182-81b437246bcf - - - - -] Reconnected to AMQP
>>> server on rabbitmq01:5672
>>> 2016-03-24 07:46:20.997 11111 INFO oslo.messaging._drivers.impl_rabbit
>>> [-] Reconnected to AMQP server on rabbitmq01:5672
>>> 2016-03-24 07:46:21.005 11111 INFO oslo.messaging._drivers.impl_rabbit
>>> [-] Reconnected to AMQP server on rabbitmq01:5672
>>>
>>> Если я правильно расцениваю Reconnect*ed*, то речь идет о успешном
>>> переподключении.
>>>
>>> Еще в пользу правильности логина/пароля говорит переодический вывод nova
>>> service-list:
>>> nova-compute     | compute01 | nova     | enabled | up
>>>
>>> В конфигурационном файле nova.conf раздел rabbit выглядит так (точно
>>> везде совпадает, т.к. вставлял через ctrl+C->ctrl+V во избежание опечаток):
>>> [oslo_messaging_rabbit]
>>> rabbit_hosts=rabbitmq01:5672,rabbitmq02:5672,rabbitmq03:5672
>>> rabbit_userid = openstack
>>> rabbit_password = openstack
>>> rabbit_retry_interval=1
>>> rabbit_retry_backoff=2
>>> rabbit_max_retries=0
>>> rabbit_durable_queues=true
>>> rabbit_ha_queues=true
>>>
>>> Журнал rabbitmq:
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> accepting AMQP connection <0.2831.0> (10.1.1.101:50740 -> 10.1.1.41:5672
>>> )
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> accepting AMQP connection <0.2828.0> (10.1.1.101:50738 -> 10.1.1.41:5672
>>> )
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> accepting AMQP connection <0.2825.0> (10.1.1.101:50736 -> 10.1.1.41:5672
>>> )
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> accepting AMQP connection <0.2834.0> (10.1.1.101:50742 -> 10.1.1.41:5672
>>> )
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> Mirrored queue 'reply_6a400f775e434bafb05db9b8b1976c29' in vhost '/':
>>> Adding mirror on node rabbit at rabbitmq02: <7323.17821.0>
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> Mirrored queue 'reply_6a400f775e434bafb05db9b8b1976c29' in vhost '/':
>>> Adding mirror on node rabbit at rabbitmq03: <7324.18726.0>
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> Mirrored queue 'compute_fanout_aa803659695f48a2ab997e6bb8bf28bf' in
>>> vhost '/': Adding mirror on node rabbit at rabbitmq02: <7323.17827.0>
>>>
>>> =INFO REPORT==== 24-Mar-2016::14:18:01 ===
>>> Mirrored queue 'compute_fanout_aa803659695f48a2ab997e6bb8bf28bf' in
>>> vhost '/': Adding mirror on node rabbit at rabbitmq03: <7324.18732.0>
>>>
>>> =ERROR REPORT==== 24-Mar-2016::14:19:41 ===
>>> closing AMQP connection <0.2825.0> (10.1.1.101:50736 -> 10.1.1.41:5672):
>>> Missed heartbeats from client, timeout: 20s
>>>
>>> =ERROR REPORT==== 24-Mar-2016::14:19:41 ===
>>> closing AMQP connection <0.2834.0> (10.1.1.101:50742 -> 10.1.1.41:5672):
>>> Missed heartbeats from client, timeout: 20s
>>>
>>> =ERROR REPORT==== 24-Mar-2016::14:20:01 ===
>>> closing AMQP connection <0.2828.0> (10.1.1.101:50738 -> 10.1.1.41:5672):
>>> Missed heartbeats from client, timeout: 20s
>>>
>>> =ERROR REPORT==== 24-Mar-2016::14:20:01 ===
>>> closing AMQP connection <0.2831.0> (10.1.1.101:50740 -> 10.1.1.41:5672):
>>> Missed heartbeats from client, timeout: 20s
>>>
>>>
>>> compute01 - 10.1.1.101
>>> rabbitmq01 - 10.1.1.41
>>>
>>> Пакетные фильтры в сети управления отключены везде.
>>>
>>> 24 марта 2016 г., 14:03 пользователь Ilya Alekseyev <ilya at oscloud.ru>
>>> написал:
>>>
>>> Явная проблема с rabbitmq.
>>>> Пароль и имя пользователя на rabbit проверяли?
>>>>
>>>> 2016-03-24 13:37 GMT+03:00 Yura Poltoratskiy <yurapoltora at gmail.com>:
>>>>
>>>>> вот часть neutron-server.log:
>>>>>
>>>>> 2016-03-24 12:27:40.140 25737 ERROR
>>>>> oslo.messaging._drivers.impl_rabbit [-] AMQP server on rabbitmq01:5672 is
>>>>> unreachable: [Errno 104] Connection reset by peer. Trying again in 1
>>>>> seconds.
>>>>> 2016-03-24 12:27:41.156 25737 ERROR
>>>>> oslo.messaging._drivers.impl_rabbit [-] AMQP server on rabbitmq01:5672 is
>>>>> unreachable: [Errno 111] ECONNREFUSED. Trying again in 1 seconds.
>>>>> 2016-03-24 12:27:42.202 25737 INFO oslo.messaging._drivers.impl_rabbit
>>>>> [-] Reconnected to AMQP server on rabbitmq02:5672
>>>>> 2016-03-24 12:27:48.786 25737 INFO oslo.messaging._drivers.impl_rabbit
>>>>> [-] A recoverable connection/channel error occurred, trying to reconnect:
>>>>> [Errno 104] Connection reset by peer
>>>>> 2016-03-24 12:28:03.580 25737 ERROR
>>>>> oslo.messaging._drivers.impl_rabbit [-] AMQP server on rabbitmq01:5672 is
>>>>> unreachable: [Errno 32] Broken pipe. Trying again in 1 seconds.
>>>>> 2016-03-24 12:28:04.606 25737 INFO oslo.messaging._drivers.impl_rabbit
>>>>> [-] Reconnected to AMQP server on rabbitmq01:5672
>>>>>
>>>>> 24 марта 2016 г., 12:24 пользователь Yura Poltoratskiy <
>>>>> yurapoltora at gmail.com> написал:
>>>>>
>>>>> Приветствую, сообщество.
>>>>>>
>>>>>> Столкнулся с непреодолимым препятствием, поэтому прошу помочь.
>>>>>>
>>>>>> Собственно, имеем деплой с нуля. Архитектура кратко такая:
>>>>>> 2 сервера - computes
>>>>>> 3 сервера - controllers
>>>>>> 3 сервера - storage
>>>>>> 1 сервер - network
>>>>>>
>>>>>> На controller'ах запущены контейнеры по одному для каждого сервиса, в
>>>>>> итоге получаем каждого сервиса по три (по одному на физическом сервере) для
>>>>>> HA.
>>>>>>
>>>>>> Все собрано на ubuntu 14.04 с подключенным cloud-archive:liberty.
>>>>>>
>>>>>> Сервер сообщений - rabbitmq.
>>>>>>
>>>>>> Собрал по документации
>>>>>>
>>>>>> http://docs.openstack.org/ha-guide/controller-ha-rabbitmq.html#rabbitmq-services
>>>>>> кластер rabbitmq.
>>>>>>
>>>>>> Дошел до запуска виртуальной машины, обнаружил, что все сервисы имеют
>>>>>> проблемы с коммуникацией с rabbitmq, в логах циклически вижу такое:
>>>>>>
>>>>>> nova-compute:
>>>>>>
>>>>>> 2016-03-24 12:00:06.833 11111 ERROR
>>>>>> oslo.messaging._drivers.impl_rabbit
>>>>>> [req-8e5b0e51-ed48-48cf-9182-81b437246bcf - - - - -] AM
>>>>>> QP server on rabbitmq01:5672 is unreachable: [Errno 32] Broken pipe.
>>>>>> Trying again in 1 seconds.
>>>>>> 2016-03-24 12:00:07.848 11111 INFO
>>>>>> oslo.messaging._drivers.impl_rabbit [-] Reconnected to AMQP server on
>>>>>> rabbitmq01:5672
>>>>>>
>>>>>> или такое
>>>>>>
>>>>>> 2016-03-24 12:05:23.910 11111 ERROR
>>>>>> oslo.messaging._drivers.impl_rabbit [-] AMQP server rabbitmq01:5672 closed
>>>>>> the connection.
>>>>>> Check login credentials: Socket closed
>>>>>>
>>>>>> Вывод nova service-list
>>>>>>
>>>>>> +----+------------------+-----------+----------+---------+-------+----------------------------+-----------------+
>>>>>> | Id | Binary           | Host      | Zone     | Status  | State |
>>>>>> Updated_at                 | Disabled Reason |
>>>>>>
>>>>>> +----+------------------+-----------+----------+---------+-------+----------------------------+-----------------+
>>>>>> | 1  | nova-consoleauth | nova02    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:30.000000 | -               |
>>>>>> | 4  | nova-conductor   | nova02    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:24.000000 | -               |
>>>>>> | 6  | nova-cert        | nova02    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:29.000000 | -               |
>>>>>> | 9  | nova-scheduler   | nova02    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:29.000000 | -               |
>>>>>> | 11 | nova-consoleauth | nova03    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:22.000000 | -               |
>>>>>> | 12 | nova-cert        | nova03    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:26.000000 | -               |
>>>>>> | 13 | nova-scheduler   | nova03    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:27.000000 | -               |
>>>>>> | 14 | nova-conductor   | nova03    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:27.000000 | -               |
>>>>>> | 17 | nova-conductor   | nova01    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:22.000000 | -               |
>>>>>> | 20 | nova-scheduler   | nova01    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:25.000000 | -               |
>>>>>> | 21 | nova-cert        | nova01    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:26.000000 | -               |
>>>>>> | 23 | nova-consoleauth | nova01    | internal | enabled | up    |
>>>>>> 2016-03-24T10:18:28.000000 | -               |
>>>>>> | 27 | nova-compute     | compute02 | nova     | enabled | down  |
>>>>>> 2016-03-24T10:15:41.000000 | -               |
>>>>>> | 29 | nova-compute     | compute01 | nova     | enabled | down  |
>>>>>> 2016-03-24T10:15:35.000000 | -               |
>>>>>>
>>>>>> +----+------------------+-----------+----------+---------+-------+----------------------------+-----------------+
>>>>>>
>>>>>> Переодически nova-compute становиться up.
>>>>>>
>>>>>> Я уже пробовал переустанавливать rabbitmq, пробовал без кластеров,
>>>>>> пробовал на отдельном сервере, вместо контейнера, все тщетно.
>>>>>>
>>>>>> Подскажите, пожалуйста, в чем проблема может быть и/или как можно
>>>>>> отловить проблему.
>>>>>>
>>>>>> Могу предоставить любую информацию дополнительно.
>>>>>>
>>>>>> Спасибо.
>>>>>>
>>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> OpenStack-ru mailing list
>>>>> OpenStack-ru at lists.openstack.org
>>>>> http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-ru
>>>>>
>>>>>
>>>>
>>>
>>> _______________________________________________
>>> OpenStack-ru mailing list
>>> OpenStack-ru at lists.openstack.org
>>> http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-ru
>>>
>>>
>>
>
> _______________________________________________
> OpenStack-ru mailing list
> OpenStack-ru at lists.openstack.org
> http://lists.openstack.org/cgi-bin/mailman/listinfo/openstack-ru
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.openstack.org/pipermail/openstack-ru/attachments/20160324/69b65bcf/attachment-0001.html>


Подробная информация о списке рассылки OpenStack-ru