Boinc ошибка расчетов

Куратор(ы):  

sashmxm   

Автор Сообщение
 

Прилепленное (важное) сообщение

СообщениеДобавлено: 02.11.2005 13:18 

[профиль]

Member

Статус: Не в сети
Регистрация: 05.01.2003
Откуда: г.Ногинск

Официальный сайт BOINC
Версия клиента: 7.16.20 от 17.10.21
Скачать:

http://boinc.berkeley.edu/download.php

  • Установка и настройка BOINC

Полезно:

  • Как настроить боинк так, чтобы в выходные использовалось 100% процессоров, а в будние 50%?
  • Ограничение потоков процессора для машин с малым кол-вом ОЗУ
  • Запуск одной из Х видеокарт в определённом проекте,выключение [ignore device] одной карты в клиенте (ATI/Nvidia)
  • Boinccmd tool — контроль клиента по расписанию или в зависимости от каких-то внешних факторов
  • Конфигурация клиента BOINC с помощью cc_config.xml
  • В настройках вычислений (Параметры — настройкаклиента) в нижнем разделе «Другое» для параметра «Запрашивать сохранение промежуточных результатов заданий примерно каждые» выставить значение от 600-900 сек
  • Запуск boinc из консоли без GUI интерфейса
Последний раз редактировалось sashmxm 06.11.2021 18:47, всего редактировалось 38 раз(а).
Запуск boinc в линуксе без GUI / Boinc 7.6.20
Реклама

Партнер
 
klopcha

Member

Статус: Не в сети
Регистрация: 22.04.2004
Откуда: Спб

Mad’Max Спасибо за инфу! :-)


_________________
Относитесь с пониманием и симпатией к идеям и устремлениям другого человека.

 
old_user

Member

Статус: Не в сети
Регистрация: 23.06.2003
Откуда: Марс

простите я новичок, сколько за сутки получу очков
пока 40 ядер по 3.07ггц … есх кластер на блейдах… надо проверить стабильность системы, как раз вам чуток очков добавлю.


_________________
2500k 4.5Ghz, 16Gb 2133mhz DDR3, 1060GTX 2050\9500

 
mingo

Junior

Статус: Не в сети
Регистрация: 02.03.2012

BOINC в заданиях: состояние, — пишет «ошибка вычислений». Кто-нибудь знает дальнейшие действия программы. Будет ли пересчитываться задание автоматически?

 
sergei.a.mochalov

Member

Статус: Не в сети
Регистрация: 12.01.2012
Откуда: Дефолт-сити

old_user
40 ядер дадут около 15000 очков наверное. Если установлены в 1 сборке — будет самый мощный донор в мире. Какого размера кластер?

 
Leonator

TSC! Russia member

Статус: Не в сети
Регистрация: 31.08.2005
Откуда: Петербург
Фото: 0

mingo
Нет.


_________________
www.btbooks.ru, www.forums.btbooks.ru — официальный русскоязычный фансайт Battletech

 
perest

Member

Статус: Не в сети
Регистрация: 05.10.2010
Откуда: ЮБутово;Лип.Обл

mingo писал(а):

Будет ли пересчитываться задание автоматически?

нет, это задание будет пересчитывать другой чей то компьютер. ошибочные задания тоже шлются на сервер, и начинают считаться следующие в очереди задания. но надо смотреть что за ошибки, бывают и сами задания глючные, потому желательно давать ссылку на эти задания, или на тот компьютер, на котором это происходит.
выделить проект Rosetta, слева жать кнопку Ваши результаты, найти в списке сбойное задание и скопировать ссылку Task ID(слева)

 
economist2000

TSC! Russia member

Статус: Не в сети
Регистрация: 20.03.2010
Откуда: Омск

old_user писал(а):

пока 40 ядер по 3.07ггц

я сам новичок, у меня очков 800 выходит на 2 ядрах 3,45ГГц (E5700), но работа — ближе к 20-22 часам в сутки. Думаю, 15-20К у тебя может получиться (в зависимотси от архитектуры), если боинк сможет загрузить все 40 потоков…

 
perest

Member

Статус: Не в сети
Регистрация: 05.10.2010
Откуда: ЮБутово;Лип.Обл

mingo, возможно задание сбойное, потому как оно завершилось с точно такой же ошибкой(Maximum disk usage exceeded) и на другом компьютере — Workunit details, правда тот компьютер не затратил на это задание столько времени.
да, проблема в месте на диске для боинка.

 
greentower

TSC! Russia member

Статус: Не в сети
Регистрация: 03.12.2010
Откуда: MSK/ZEL

у меня вопрос следующий: бывают ошибки вычислений(очень редко), хотя у меня точно ничего не разогнано. Это нормально для BOINC?

 
rus@lan

Member

Статус: Не в сети
Регистрация: 05.02.2012
Откуда: Moscow

Вопрос: Есть ли удаленная установка boinc по сети? Админские права есть. Комп может быть заблокирован. Разблокировка нежелательна.
Установка должна быть скрытой!

 
old_user

Member

Статус: Не в сети
Регистрация: 23.06.2003
Откуда: Марс

sergei.a.mochalov кластер маленький … 20*19 дюймов…. блейды 10 дюймовые …
попробовал 56 ядер …7 виртуалок по 8 ядер …. одновременно запустил на каждом сети*хоме … 100% загрузка …. часов 10 посчитал …. не дождался 24х часов чтоб узреть результат… сманили майнить биткоин ))


_________________
2500k 4.5Ghz, 16Gb 2133mhz DDR3, 1060GTX 2050\9500

 
ToEst

TSC! Russia member

Статус: Не в сети
Регистрация: 19.07.2010
Откуда: Казань

На днях задался одним вопросом: может ли boinc по расписанию подключать счетные потоки: чтобы например с 8:00 до 18:00 3 потока, а в остальное время 6 потоков на 6-ядернике. Не нашел подобной фичи. Может есть костыль под это дело?


_________________
RC64 (1997-1998); FaD (2005); F@H (2005-2006, 2011-…); S@H (2011-…); R@H (2011-…); WUProp (2012-…); Poem/Sat/Simap (2013-…)

 
ToEst

TSC! Russia member

Статус: Не в сети
Регистрация: 19.07.2010
Откуда: Казань

ToEst писал(а):

На днях задался одним вопросом: может ли boinc по расписанию подключать счетные потоки: чтобы например с 8:00 до 18:00 3 потока, а в остальное время 6 потоков на 6-ядернике. Не нашел подобной фичи. Может есть костыль под это дело?

Поразмыслю вслух. Можно реализовать следующим образом (под «вендой»):

1. Написать exe или bat патч, который изменяет параметр <p_ncpus></p_ncpus> файла «client_state.xml» согласно переданному параметру, например «патч.bat 4» или «патч.exe 8». Этот параметр в xml как раз отвечает за кол-во нагруженных потоков.
1. Служба «boinc» на ручной запуск
2. Инсталлить nncron

Порядок работы на 8-поточном проце:
Прописать в nncron.tab скрипт, который в случае если время запуска ОС например >21:00, то выполняет следующий батник:

Код:

патч.exe 8
net start boinc

а если время старта >7:00, то

Код:

патч.exe 4
net start boinc

перед патч.exe еще можно на всякий случай выполнять net stop boinc (для верности).

Соотв. вопрос: есть ли консольная тулза, позволяющая менять значение конкретного параметра xml-файла. Или кодить придется?


_________________
RC64 (1997-1998); FaD (2005); F@H (2005-2006, 2011-…); S@H (2011-…); R@H (2011-…); WUProp (2012-…); Poem/Sat/Simap (2013-…)

 
OneginForte

TSC! Russia member

Статус: Не в сети
Регистрация: 24.06.2012
Откуда: Нижний Тагил

ToEst писал(а):

Соотв. вопрос: есть ли консольная тулза, позволяющая менять значение конкретного параметра xml-файла. Или кодить придется?

Есть смысл написать несколько cmd, для каждого интервала времени свой и повешать как задания. По моему cmd позволяет парсить текст, если нет, то просто подменять конфиг файл.


_________________
Name: Intel Core i5-4570 CPU @ 3.20GHz
Architecture: Haswell (22 nm)
Frequency: 3392.22 MHz (34 * 99.77 MHz)
RAM Speed : 798.2 MHz (1:6) @ 9-9-9-27

 
Mad’Max

TSC! Russia BOINC-manager

Статус: Не в сети
Регистрация: 19.01.2010
Откуда: Санкт-Петербург

Давно осуждали, так что наверно не актуально, но может кому еще пригодится.
Всякий контроль по расписанию или в зависимости от каких-то внешних факторов лучше всего делать через
Boinccmd tool
Простые вещи (типа включить/выключить счет на CPU/GPU разрешить/запретить интернет активность и т.д.) делаются непосредственно консольными командами (которые можно из какого-либо скрипт-файла запускаемого по расписанию подавать).
Для более сложных редактировать/подменять конфиг-файл и давать консольную команду его применить.
В client_state.xml лучше не лазать с правками, т.к. там все постоянно меняется самим клиентов(настройки могут как слетать, так и запортить нужную информацию можно случайно), а чтобы применить свои изменения нужен будет полный перезапуск.
Настройки лучше изменять в global_prefs_override.xml, а применять внесенные изменения консольной командой —read_global_prefs_override
Получится аналог того, как если вручную зайти в меню настроек и поменять там что-нибудь.

А при соотвествующей настройке делать это можно не только для локального клиента, но и консольными скриптами на 1м компе рулить клиентом(клиентами) работающим на другом по сети.

 
Aleksey314

Junior

Статус: Не в сети
Регистрация: 13.09.2012
Откуда: Иркутск

Подскажите, можно ли установить более одного (2) клиента Boinc на одном компьютере? Хочу чтобы каждый клиент работал с одним проектом — один с Rosetta, другой с GPUgrid. И делали это одновременно. Просто с тех пор как добавил GPUgrid, для Rosetta перестали загружаться новые задания. Видимо дело в том как Boinc распределяет ресурсы приложения… Пробовал установить для Rosetta Resource share 200 и 300, но задания все равно не приходят. Спасибо заранее.

нашел инструкцию

http://forums.anandtech.com/showthread.php?t=2254389

кто-нибудь так делал, работает?

 
economist2000

TSC! Russia member

Статус: Не в сети
Регистрация: 20.03.2010
Откуда: Омск

Aleksey314
Параллельный счет может вызвать какие-нибудь побочные эффекты, в виде непропорционального замедления, появления ошибок. Мне не понравился счет POEM параллельно с Розеттой.
Почему бы просто не пользоваться встроенной в клиент функцией — «переключаться между проектами через ___ часов», а кэш заданий сделать побольше, несколько суток, при условии круглосуточного счета?

 
Aleksey314

Junior

Статус: Не в сети
Регистрация: 13.09.2012
Откуда: Иркутск

economist2000
Просто хотелось бы чтобы одновременно работали оба проекта, чтобы не простаивал ни процессор, ни видеокарта.
Но вообще-то задания Розетты в какой-то момент все-таки загрузились, правда их меньше чем раньше, всего 8, сейчас все работают. До добавления второго проекта всегда штук 10-15 висели на очереди. Посмотрим, сразу ли придут новые, после окончания текущих…
А где поменять кэш заданий и чем это поможет? Это Target CPU run time? У меня там 8 часов. Кстати, как лучше, может там побольше выставить, раз комп постоянно включен?

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Лаборатория

Новости

Добрый день !

ubuntu 18.04, 20.04 lts

Не считает задания атласа доходит до 10.2 % пишет ошибка вычисления

что и как ставил

sudo apt-get update

sudo apt-get instal boinc-client boinc-manager bouinc-virtualbox

Кто что скажет ?

Array

Цитата: Вячеслав от 06.05.2021, 18:41

Добрый день !

ubuntu 18.04, 20.04 lts

Не считает задания атласа доходит до 10.2 % пишет ошибка вычисления

что и как ставил

sudo apt-get update

sudo apt-get instal boinc-client boinc-manager bouinc-virtualbox

Кто что скажет ?

Это что то на эльфийском, я не понимаю этого языка! ))

Array

Ставил себе BOINC-клиент не из репозитария, а скачивал с сайта. Затем — доставляли библиотеки VBox-а. Проект, которому была нужна виртуализация — работал. Но иногда задания подвисали и их приходилось рубить. Ubuntu 18.04.

Array

Author Message

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62625 — Posted: 21 Jun 2015, 19:34:21 UTC

I’m getting a lot of computation errors for projects I’ve recently added or re-added, after a few years of mostly — and trouble free — running of only SETI@home and World Community Grid on this computer

Any idea as to why? I would post in the NumberFields@home board, for example, but lacking any credit I’m prevented from letting them know they have a problem/finding out what my problem is.

Mid-2007 24″ 2.8GHz iMac, 4GB RAM, ATI Radeon HD 2600 Pro 256MB VRAM, OS X 10.6.8


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62625 · Report as offensive

Claggy
Send message
Joined: 23 Apr 07
Posts: 1112
United Kingdom

Message 62626 — Posted: 21 Jun 2015, 20:12:34 UTC — in response to Message 62625.  
Last modified: 21 Jun 2015, 20:12:48 UTC

I’m getting a lot of computation errors for projects I’ve recently added or re-added, after a few years of mostly — and trouble free — running of only

Any idea as to why?

How about checking the error codes of the failed tasks at the projects concerned?

Claggy

ID: 62626 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62632 — Posted: 21 Jun 2015, 22:37:52 UTC — in response to Message 62626.  

If you can tell me how, I will. The only stderr.txt files (is that what I’m after?) are in /Library/Application\ Support/BOINC\ Data/slots and have nothing to do with the project’s that have failing apps.


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62632 · Report as offensive

Profile Jord
Volunteer tester
Help desk expert
Avatar
Send message
Joined: 29 Aug 05
Posts: 15386
Netherlands

Message 62633 — Posted: 22 Jun 2015, 1:13:30 UTC

Your list with tasks for your computer, http://numberfields.asu.edu/NumberFields/results.php?hostid=23920, click on the Task ID for details of what the tasks sent back. In your case, signal 11, or translated a segmentation error pointing to a problem with your memory, virtual memory (page file) or that it’s a bad batch of tasks.

However, if you’re the only one returning these as an error and consistently over two or more projects, you best go look into a problem with the RAM or page file on that computer.


ID: 62633 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62634 — Posted: 22 Jun 2015, 2:35:18 UTC — in response to Message 62633.  

I have no other issues, so I have to blame BOINC given it’s happening across multiple projects, all newly added on this machine (or re-added after being removed years ago) and applications within projects, but not all projects.

If I had RAM or VM problems I’d see evidence elsewhere, unless it was an extremely subtle issue. But it has been months since my last kernel panic, and I get one or two of those a year, which is normal enough, given this Mac runs 24/7 and is heavily used.

Restarting BOINC and restarting my machine has had no effect. Several projects continue to run unaffected. I guess I could try a completely clean reinstall of BOINC and the projects, but that would entail the loss of some work which I dislike doing, but I guess that is no big thing.


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62634 · Report as offensive

Profile Jord
Volunteer tester
Help desk expert
Avatar
Send message
Joined: 29 Aug 05
Posts: 15386
Netherlands

Message 62635 — Posted: 22 Jun 2015, 6:21:10 UTC — in response to Message 62634.  
Last modified: 22 Jun 2015, 6:27:13 UTC

BOINC doesn’t do any calculations, doesn’t load your memory to capacity, it is merely managing things. Its memory use is minor. To blame it and not (memtest) look elsewhere only because you feel it cannot be true, is just idly wishing

 
Project science applications running under BOINC stress your hardware in ways that the other software on your system, including games, have never done before. Your wingmen (the others running the same work as you) manage to finish the work without errors, so what, their BOINC is better?


ID: 62635 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62639 — Posted: 22 Jun 2015, 11:04:13 UTC — in response to Message 62635.  

This Mac only has 4GB RAM — it is always all in use, and I’ve been running SET@home and World Community Grid without any troubles, not to mention other apps for years. I still run a bunch of BOINC projects and apps ok.

If this is a RAM problem, it’s the most subtle one I’ve ever encountered…


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62639 · Report as offensive

Profile Jord
Volunteer tester
Help desk expert
Avatar
Send message
Joined: 29 Aug 05
Posts: 15386
Netherlands

Message 62644 — Posted: 22 Jun 2015, 14:57:04 UTC — in response to Message 62639.  
Last modified: 22 Jun 2015, 16:44:22 UTC

The computation error is something that the science application does.
The contents of the stderr.txt as shown in the TaskID is something that the science application exits with.

So I searched at Numberfields forums for signal 11 and immediately got this thread dated yesterday, in which Eric Driver, admin of Numberfields writes:
Looking through recent Mac results I found several other Mac users having the same problem, but the majority were fine. The ones getting the signal 11 all had Darwin OS version 11.4.2 or earlier. Also, all the good results were from Darwin version 12.6.0 or higher.
and
My guess is that it’s related to the version of the build tools and/or OS used to build the apps. Since I don’t have a mac, I use a virtual machine, so I am kind of stuck with the OS version that came with it (Mountain Lion). Again, I’m not that familiar with the Mac OS, but it appears that any OS predating Mountain Lion (12.0.0) may have problems running NumberFields@home.

So in this case at Numberfields it would appear to be a problem with your operating system versus their science applications being incompatible.

Edit: I’ve asked Eric to make a news item out of it, which he has done.

Apropos, for those trying to post on forums without having credit or RAC, even the Numberfields project has a Questions and Answers forum where you can post without requiring a RAC higher than 1 and at least N credit. Most projects do.


ID: 62644 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62649 — Posted: 22 Jun 2015, 22:16:51 UTC — in response to Message 62644.  

Cheers for the info, though I’d still need any credit to post on a totally new (to me) project’s page.

Also — this has happened with a bunch of projects, not just Numberfields, so a bunch of them are obviously mis-compiling their apps for older versions of OS X.


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62649 · Report as offensive

Profile Jord
Volunteer tester
Help desk expert
Avatar
Send message
Joined: 29 Aug 05
Posts: 15386
Netherlands

Message 62650 — Posted: 22 Jun 2015, 23:46:41 UTC — in response to Message 62649.  

Cheers for the info, though I’d still need any credit to post on a totally new (to me) project’s page.

Not on the Questions and Answers forum, these forums are specifically added without the requirement to have credit or RAC so you can post when you have problems from the start. Just to prove this, see this user Recliner posting message nr 1273 with zero credit and zero RAC.

The main NF forums require credit and a RAC higher than 1, which makes sure that spammers can’t post their crap there.

this has happened with a bunch of projects

Which ones?

.. so a bunch of them are obviously mis-compiling their apps for older versions of OS X.

Not so obvious. It can be lots of other things. But without you telling us about the projects that have the problems, that’s difficult to figure out. Thus far you only said you do not have problems with Seti and WCG.


ID: 62650 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62651 — Posted: 23 Jun 2015, 2:25:13 UTC — in response to Message 62650.  

The support form you linked to wasn’t one I could see.


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62651 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62652 — Posted: 23 Jun 2015, 2:46:22 UTC — in response to Message 62650.  

this has happened with a bunch of projects

Which ones?

.. so a bunch of them are obviously mis-compiling their apps for older versions of OS X.

Not so obvious. It can be lots of other things. But without you telling us about the projects that have the problems, that’s difficult to figure out. Thus far you only said you do not have problems with Seti and WCG.

All the below contain computation or similar looking errors.

https://einstein.phys.uwm.edu/results.php?userid=81109
http://csgrid.org/csg/results.php?userid=94101
http://climateapps2.oerc.ox.ac.uk/cpdnboinc/results.php?userid=98031
http://escatter11.fullerton.edu/nfs/results.php?userid=31713
http://boinc.fzk.de/poem/results.php?userid=10911
https://boinc.bakerlab.org/rosetta/results.php?userid=2041
http://boinc.umiacs.umd.edu/results.php?userid=3381

All were recently added or returned to this machine. Some have been running on other computers I only see every few months, so maybe things have also been going wrong there and I’ve not noticed.

But on this particular machine, at least while booted into OS X (I dual boot into WinXP for gaming, in the main, and a couple other tasks, during which I run a couple projects lacking Mac support) I’ve only been running SETI and WCG both of which almost always run fine, e.g. —

[/url]http://setiathome.berkeley.edu/results.php?userid=8098294[url]


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62652 · Report as offensive

Claggy
Send message
Joined: 23 Apr 07
Posts: 1112
United Kingdom

Message 62653 — Posted: 23 Jun 2015, 3:43:57 UTC — in response to Message 62651.  

The support form you linked to wasn’t one I could see.

Straight under the search forums box it says ‘If you have a question or problem, please use the Questions & Answers section of the message boards.’

Claggy

ID: 62653 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62654 — Posted: 23 Jun 2015, 4:28:28 UTC — in response to Message 62653.  

I admit I did not notice that. But why would I? It’s in text I would not expect a forum link to be. I wasn’t reading the rest of the page. I was reading the list of forums which oddly does not include the support one. So I think this is both a problem of me not looking hard enough, and poor page design :-)


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62654 · Report as offensive

Profile Jord
Volunteer tester
Help desk expert
Avatar
Send message
Joined: 29 Aug 05
Posts: 15386
Netherlands

Message 62656 — Posted: 23 Jun 2015, 5:49:34 UTC — in response to Message 62652.  
Last modified: 23 Jun 2015, 5:53:06 UTC

http://einstein.phys.uwm.edu/show_user.php?userid=81109

taskID http://einstein.phys.uwm.edu/result.php?resultid=504231187 shows process exited with code 193 (0xc1, -63)
Crashed executable name: einstein_S6BucketFU2UB_1.01_x86_64-apple-darwin__X64
Machine type Intel 80486 (64-bit executable)
System version: Macintosh OS 10.6.8 build 10K549
Sun Jun 21 04:09:14 2015

That’s something you can post at the Help Desk sections of their forum, where you can post without needing credit or RAC.

http://csgrid.org/csg/show_user.php?userid=94101

Does indeed exit with process got signal 11, something you should be able to ask about in their forums.

http://climateapps2.oerc.ox.ac.uk/cpdnboinc/show_user.php?userid=98031

The erroneous models crashed with process exited with code 9 (0x9, -247), but then you also managed to bring a couple of them home and to fruition. One possible bottleneck as always on CPDN is that your computer has only got 4GB of memory, in which it has to store the OS, CPDN and anything else running at the time. CPDN is memory hungry.

http://escatter11.fullerton.edu/nfs/show_user.php?userid=31713

No problems with 15e Lattice Sieve v1.10 and signal 11 again with 16e Lattice Sieve V5 v1.11 is something you will have to ask at their forums. Although, apparently they already know about it for an older app.

http://boinc.fzk.de/poem/show_user.php?userid=10911

process got signal 5, that one I don’t know. dyld: unknown required load command 0x80000022, you might want to report that at their forums.

But doesn’t everyone run POEM on a GPU these days? Perhaps that they don’t test CPU apps that strongly.

https://boinc.bakerlab.org/rosetta/show_user.php?userid=2041

Same error as at POEM, process got signal 5, something you’ll have to ask at the Rosetta forums.

http://boinc.umiacs.umd.edu/show_user.php?userid=3381

And also signal 5.

http://setiathome.berkeley.edu/show_user.php?userid=8098294

Great, not one error in sight. But then, one cannot easily compare the load on the CPU and memory that’s done by Seti to that of any of the other projects you tried. The nearest is Einstein, and then can only be compared because both do things in space and with the Arecibo dish, but then comparisons quickly evaporate.

And as shown, it’s not always signal 11.
Checking the man page for signal 5, I see that it is thrown on a Trace/Breakpoint Trap, so deliberately added by the application’s programmer. He should know why his app throws the error, and thus you should ask at their forums.
Signal 11 is a segmentation error, or an Invalid memory reference. Can be caused by problematic memory, or an application addressing a wrong part of the memory.


ID: 62656 · Report as offensive

Profile Wizardling
Avatar
Send message
Joined: 4 Mar 09
Posts: 39
New Zealand

Message 62660 — Posted: 23 Jun 2015, 8:19:06 UTC — in response to Message 62656.  

Cheers Ageless for that analysis :-) I shall post about the respective issues to their respective forums, as per your advice.

I’d also add looking at my WCG results I see no errors either, however I couldn’t see an easy way to post a link that would work outside my login, but here’s a screenshot: I mention this as some of the WCG projects like the current The Clean Energy Project — Phase 2 required a bunch of RAM, in this application’s case — 1,024 MB. SETI@home by comparison only needs around 64MB of RAM. So if I had some kind of subtle RAM issue, it feels like it ought to have shown up in other ways, like the beefier WCD apps, and of course all the other stuff I have this aging 2007 era iMac doing.

With it’s paltry 4GB RAM it uses lots of VM and there is considerable read/write to the and from the VM pagefile. My RAM and VM system get quite the workout 24/7, and till adding/re-adding these extra BOINC projects, I saw no obvious issues, big or small.

I’m not saying to those who have suggested RAM issues that it can’t be them. It just doesn’t feel like a RAM issue, if you know what I mean :-) RAM issues in the past were sometimes subtle, but always noticeable in a more widespread manner. I’d see a variety of app’s and system processes giving errors, crashing and experiencing unstable behaviour, kernel panics, freezes, unusual RAM activity, etc. It has been a long time since I owned a computer that had enough RAM and simple/efficiently written enough apps, that a bad RAM issue only noticeable at a certain usage point wouldn’t happen constantly.

That said, I’ll try to spend overnight running a memtest as soon as I can spare this machine (it does more than crunch BOINC project data, though I often enjoy seeing the BOINC results more than the serious work I do on it myself, heh). If you guys have any other suggestions troubleshooting-wise, I’m open to some more investigative work!

TIA :-)


«The surest sign that intelligent life exists elsewhere in the universe is that it has never tried to contact us.» — Calvin and Hobbes (Bill Watterson)

ID: 62660 · Report as offensive

Copyright © 2023 University of California.
Permission is granted to copy, distribute and/or modify this document
under the terms of the GNU Free Documentation License,
Version 1.2 or any later version published by the Free Software Foundation.


Go to BOINC


r/BOINC

A subreddit dedicated to all things BOINC, a platform enabling the public to volunteer their computer’s processing capability towards research projects distributed across the globe. Users can decide which projects they participate in, using the free and open-source BOINC client software.




Members





Online



Boinc Android gives «computation errors» all the time since update

I run it on an old tablet and my new Samsung S10e. Both worked fine. Then a week back my phone had a major Android update and ever since I get nothing but «computation error» on all jobs (they don’t even run 1 second after download). App update needed? Don’t see one on Play Store.

I see this bug often too. It happens if max_concurrent is used on app OR project level. Both use cases cause similar error of infinite work downloading loop ignoring all work cache setting.

I run rr_sim debug and confirm — it happens due to a wrong calculation of amount of work BOINC already have.
rr_sim shows than BOINC stops calculating WUs for an app (OR project if max_concurrent is set on project level) after counting only up to max_concurrent WUs. Ignoring all others WUs in work queue after reaching max_concurrent.

It is a clear bug because max_concurrent is limiting only number of jobs to run in parallel (simultaneously). NOT a total number of jobs to run for an app/project.

For example.
I use max_concurrent to limit Rosett@Home to run max 4 WUs in parallel (on project level in my case).
Each WU from R@H run for a ~8 hours and have a deadline of 3 days
I use 1 day work cache setting, so its should be about 12 WUs in work queue to match 1 day setting on 24/7 client.
But BOINC count only 4 WUs and «thinks» it have work only for ~8 hours in queue while setting is set to 1 day .
So it starts downloading WUs in infinite loop (hundreds of WUs until it stopped by server side limit/quota of number of task in progress per one host), because due to bug it still count only 4 WUs in work cache regardless of how many it actually has.

And its not a minor bug. Because it leads not just to an «excessive» work cache (exceeding users settings and expectation) but download of huge amounts of WUs most of which will miss deadline and will be aborted.

It puts stress on projects servers, «burn» client traffics on limited/metered internet connections, often leads to lost of significant amounts of computation (because of task reported too late and discarded — BOINC automatically abort task with missed deadline only if it was not started before deadline, but if it was already started — keeps computing task with already missed deadline), puts client often into «panic» (high priority) mode due to missing deadlines and so produce havoc with work balancing on multi-project clients.

Понравилась статья? Поделить с друзьями:
  • Boiling point ошибка
  • Bmw n55 valvetronic ошибка
  • Boinc ошибка вычислений
  • Bmw n52 ошибка 2а9а
  • Boge компрессор ошибки