Opencaching.de down

Hier geht es um die technische Bereitstellung der Plattform - KnowHow im Bereich Virtualisierung und CentOS können sind hier sehr hilfreich
Antworten
mbirth

[quote="4_Vs"]
Der manuelle Reset kostet übrigens auch Geld :) - auch, oder gerade am Sonntag :)
[/quote]

Auch, wenn man irgendwie nachweisen kann, dass die Kiste "einfach so", also nicht wegen der Software, ausgestiegen ist?
Benutzeravatar
Metrax
Vereinsmitglied
Vereinsmitglied
Beiträge: 327
Registriert: 17.03.2012, 10:53

Ich wollte eigentlich nur darauf hinweisen, dass immer nur darüber geredet wird, wenn der Server gerade oder kurz vorher ausgefallen ist. Dazwischen passiert offenbar nichts.

Ich wollte Nils nicht persönlich angreifen, dass war nicht meine Absicht. Wenn dies so rüber gekommen ist, entschuldige ich mich hiermit dafür!

Was Hetzner angeht:
Ich betreibe ja nun schon seit über 14 Jahren diverse Server bei unterschiedlichen Providern. Was Hetzner angeht, hab ich bislang nur gute Erfahrungen gemacht. Derzeit sind es bei Hetzner 2 kommerzielle und ein privater Server, alle laufen Einwandfrei. Es gab bisher 3 mal Hardware Probleme, 1x RAM defekt, 2x HDD zeigten Anzeigen für Probleme. Alle wurden ohne Diskussion innerhalb von kurzer Zeit behoben. Ich kann auch Michaels Aussage nicht nachvollziehen, dass ein manueller Reset Geld kostet? Ich kann das Ticket dafür für alle meine Server kostenlos im Webinterface beauftragen. Warum zahlt Ihr Geld dafür? Was die Hardware angeht ... man kann unter Linux jede Menge Hardware-Monitoring aktivieren. Ich habe es noch nie gehabt, dass wir Hardware-Probleme nicht identifizieren konnten. Und ich verwalte derzeit in einem 5 Mann Team 388 Server. Meine Meinung ist, dass wir hier unsere Möglichkeiten noch nicht ausgenutzt haben um die Ursache für die Abstürze zu finden.

Worum es mir eigentlich geht ist:
Soweit ich das mitbekommen habe, haben wir derzeit 2 Admins ... Nils und Rainer. Es gab einen dritten Bewerber, aus dem aber wohl nichts geworden ist. Rainer sagt von sich selbst, dass er für vieles zu wenig Ahnung hat (was ich auch nicht kritisieren möchte). Nils hat wenig Zeit, was ich auch nicht direkt kritisieren möchte, er kriegt ja schließlich kein Geld, etc. dafür. Aber wenn wir einen solchen Engpass haben, sollten wir alles daran setzen ihn zu beheben. Und wie schon oben erwähnt, gibt es Diskussionen dazu nur wenn der Server mal wieder offline war. Und das ist das was ich hier kritisieren möchte!
Logic will get you from A to B. Imagination will take you everywhere. (Albert Einstein)
[url=http://www.opencaching.de/viewprofile.php?userid=212145][img]http://www.opencaching.de/statpics/DE/212145.jpg[/img][/url]
[url=http://www.facebook.com/opencaching.de]OpenCaching.de auf Facebook[/url]
following

ClanFamily (Mirco) hat geschrieben: Extrem Auffällig war, das in den letzten Tagen und Wochen häufiger zu Serverausfällen kam.
Ich vermute, dass das mit dem Beginn der Geocaching-Saison zu tun hat. Die Nutzeraktivität und Systemlast steigt ab April stark an, und zumindest in der Anfangszeit gab es Hinweise darauf, dass die Ausfälle sich bei hohem Netzwerktraffic häufen.
Metrax hat geschrieben: Es gab bisher 3 mal Hardware Probleme, 1x RAM defekt, 2x HDD zeigten Anzeigen für Probleme. Alle wurden ohne Diskussion innerhalb von kurzer Zeit behoben.
Wir hatten einmal Verdacht auf einen Festplattendefekt, haben den Server von Hetzner prüfen lassen (dafür war OC 12 Stunden lang offline), und die haben nix gefunden. Erst als es Nils gelang, den tatsächlich bestehenden Effekt anhand von Festplatten-Logs nachzuweisen, wurde die defekte Hardware durch Hetzner ausgetauscht. Und dass der Provider mal eben die gesamten Backups ersatzlos schreddert (wir zahlen m.W. 10€ pro Monat für den Backup-Space) ist ein Unding.

Außerdem sei noch auf [url=http://forum.opencaching-network.org/http://localhost//viewtopic.php?p=37603#p37603]das hier[/url] verwiesen.

Die Entscheidung für Hetzner fiel damals auf deinen Vorschlag hin, und du magst gute Gründe haben an Hetzner festzuhalten, aber Opencaching.de hat definitiv schlechte Erfahrungen mit diesem Anbieter. Es wurde nur zu lange versucht, das Problem auszusitzen. Wenn's meine private Website wäre hätte ich dieser Sache alleroberste Priorität eingeräumt, bis es behoben ist. GC.com hat seit jeher Probleme mit den eigenen Systemen, und ich find's schade dass OC.de die Chance bislang nicht genutzt hat, sich als die stabile Alternative zu präsentieren. Unter dem alten Betreiber lief OC bombenstabil mit Uptimes > 1 Jahr (auf einer alten Sun), war aber voller Software-Bugs und -Baustellen. Nun ist es umgekehrt. Ich denke aber, auf Sicht von 6 Monaten sollten wir das hinbekommen.
Aber wenn wir einen solchen Engpass haben, sollten wir alles daran setzen ihn zu beheben.
Will heißen: Lasst mich an die Server, ich mach das schon. Es gibt Gründe dafür, warum das nicht passiert, aber die gehören nicht hierher.
Zuletzt geändert von following am 03.06.2015, 13:12, insgesamt 1-mal geändert.
Benutzeravatar
Metrax
Vereinsmitglied
Vereinsmitglied
Beiträge: 327
Registriert: 17.03.2012, 10:53

following hat geschrieben:
Aber wenn wir einen solchen Engpass haben, sollten wir alles daran setzen ihn zu beheben.
Will heißen: Lasst mich an die Server, ich mach das schon. Es gibt Gründe dafür, warum das nicht passiert, aber die gehören nicht hierher.
Ich hab versucht es so zu formulieren, dass es nicht so klingen soll. Mir ist egal, wer es macht, Hauptsache es geht mal voran. Ich biete meine Hilfe nur immer wieder mal an, weil mir halt doch ein bisschen was an dem Projekt liegt.
Logic will get you from A to B. Imagination will take you everywhere. (Albert Einstein)
[url=http://www.opencaching.de/viewprofile.php?userid=212145][img]http://www.opencaching.de/statpics/DE/212145.jpg[/img][/url]
[url=http://www.facebook.com/opencaching.de]OpenCaching.de auf Facebook[/url]
Benutzeravatar
4_Vs
Vereinsmitglied
Vereinsmitglied
Beiträge: 3150
Registriert: 18.03.2012, 07:25

So,

jetzt haben wir festgestellt, dass mal wieder mehr zwischen den Zeilen gelesen worden ist als die Zeilen selber und es ist die ein oder andere unglückliche Formulierung getroffen worde, aber im Endeffekt wollen wir ja alle, das es voran geht :)

Also, lasst uns konstruktiv an die Sache herangehen, vorher nochmal tief durchatmen, langes Wochende genießen, ein wenig Cachen gehen und ab Montag gehen wir das Thema gemeinsam an.

SG
Micha
Whenever I try to plan something, it doesn't seems to work out. So why plan, it only leads to disappointment! (Eddie van Halen)
Benutzeravatar
mic@
Vereinsmitglied
Vereinsmitglied
Beiträge: 6623
Registriert: 04.12.2009, 00:31

[quote="following"]Die Nutzeraktivität und Systemlast steigt ab April stark an, und zumindest in der Anfangszeit gab es Hinweise darauf, dass die Ausfälle sich bei hohem Netzwerktraffic häufen.[/quote]

Der jüngste Ausfall geschah gegen 22.50 Uhr.
Da dürfte kein großer Netzwerktraffic passiert sein, oder kann sich das auch aufschaukeln?
Falls ja, also ein Memory-Leak existiert, was mit der Zeit immer größer wird, dann plädiere
ich für einen täglichen kontrollierten Reboot des Servers um 4 Uhr früh. Das dürfte den wenigsten auffallen  8)

Ansonsten noch ein Wort zu Metrax: Je mehr Leute bereit sind, sich um den oc-Server zu kümmern,
desto besser. Nils sollte zwar als Technik-Chef weiter die Strippen in der Hand halten, aber über eine
zusätzliche Hilfe wird er sicherlich nichts einzuwenden haben. Und sechs Augen sehen auch mehr als vier!
Just my 0.02 Euro.
following

[quote="mic@"]
[quote="following"]Die Nutzeraktivität und Systemlast steigt ab April stark an, und zumindest in der Anfangszeit gab es Hinweise darauf, dass die Ausfälle sich bei hohem Netzwerktraffic häufen.[/quote]

Der jüngste Ausfall geschah gegen 22.50 Uhr.
Da dürfte kein großer Netzwerktraffic passiert sein, oder kann sich das auch aufschaukeln?
[/quote]

Hmja, der vorletzte Ausfall war mitten in der Nacht, da war nicht viel los.
Benutzeravatar
Slini11
Vereinsmitglied
Vereinsmitglied
Beiträge: 1164
Registriert: 17.03.2012, 13:25

Der Ausfall vom Sonntag war zudem gegen 6 Uhr morgens und die drei ?  Ausfälle davor wiederum im Zeitraum zwischen 22:50 und 23:30 (wenn ich mich nicht irre).
[url=http://www.opencaching.de/viewprofile.php?userid=159941][img]http://www.opencaching.de/statpics/DE/159941.jpg[/img][/url]
mbirth

Just for the record ... ich bin auch noch da und fit mit Debian-Varianten und RHEL/CentOS.
Benutzeravatar
bohrsty
Administrator
Administrator
Beiträge: 1367
Registriert: 30.03.2012, 22:54

[quote="Metrax"]
[...]
Ich wollte Nils nicht persönlich angreifen, dass war nicht meine Absicht. Wenn dies so rüber gekommen ist, entschuldige ich mich hiermit dafür!
[...]
[/quote]

alles gut, ich fuehle mich dadurch nicht wirklich "angegriffen", ich wollte mit meinem (genauso kurzen) kommentar nur darauf hinweisen, dass die aussage wie du sie in aller kuerze formuliert hast, fuer mich keine grundlage fuer eine diskussion zu irgendeinem thema ist... vielleicht das naechste mal einfach direkt formulieren, was gemeint ist, dann kann man sich auch auf professioneller ebene darueber unterhalten und eine loesung finden...

und vielleicht zur kurzen erklaerung, ich habe bisher kein direktes angebot zur unterstuetzung abgelehnt, ich bin aber jemand, der "den leuten" hinterherlaeuft, die irgendwann mal irgendwo fallengelassen haben, dass sie da- oder hiervon ahnung haben... wenn mich (bzw. das technikteam bei oc) jemand aktiv unterstuetzen will oder es ideen zu einem thema oder problem gibt, erwarte ich, dass aktiv nachgefragt wird "kann ich dich/euch unterstuetzen, von diesem oder jenem thema habe ich ahnung..."

@Robert: falls ich ein solches angebot von dir uebersehen haben sollte, war es sicherlich nicht mit absicht... und auch ich kann ueber meinen schatten springen: wenn du ideen hast, was das hier verursacht, lass uns gerne per email weiter darueber schnacken...


@all: vielen dank fuer die unterstuetzung! ich waere aber dafuer, dieses thema an dieser stelle zu beenden (ohne die moderatoren-funktion zu nutzen ;) ), fundierte ideen zu gruenden ueber die ausfaelle oder analysen sind natuerlich weiter gerne genommen...
gruss Nils (bohrsty)

Bild
roamer_ge

[quote="bohrsty"]


@all: vielen dank fuer die unterstuetzung! ich waere aber dafuer, dieses thema an dieser stelle zu beenden (ohne die moderatoren-funktion zu nutzen ;) ), fundierte ideen zu gruenden ueber die ausfaelle oder analysen sind natuerlich weiter gerne genommen...
[/quote]

Ist es denn immer noch das gleiche Problem, das vor 2 Jahren hier [url=http://forum.opencaching-network.org/http://localhost//viewtopic.php?t=8]http://forum.opencaching-network.org/http://localhost//viewtopic.php?t=8[/url] beschrieben wurde?
mambofive
Micro
Micro
Beiträge: 438
Registriert: 08.09.2014, 16:58

Die Seite ist mal wieder unten, lt. http://flopp.grus.uberspace.de/oc-monitor/ exakt seit 9:00 Uhr... Läuft da um 9:00 ein cron-job, der das verursachen kann?
Benutzeravatar
4_Vs
Vereinsmitglied
Vereinsmitglied
Beiträge: 3150
Registriert: 18.03.2012, 07:25

Das ist echt zum Kotzen, gut dass die Entscheidung zu einer Änderung gefallen ist.

Jetzt muss Nils nur noch aus dem Urlaub kommen, dann gehen wir das an
Whenever I try to plan something, it doesn't seems to work out. So why plan, it only leads to disappointment! (Eddie van Halen)
dl6hbo

[quote="mambofive"]
Die Seite ist mal wieder unten, lt. [url=http://flopp.grus.uberspace.de/oc-monitor/]http://flopp.grus.uberspace.de/oc-monitor/[/url] exakt seit 9:00 Uhr... Läuft da um 9:00 ein cron-job, der das verursachen kann?
[/quote]

Bin dran !

Kurz vor 11:00 war ich fertig damit.
Zuletzt geändert von dl6hbo am 13.06.2015, 11:41, insgesamt 1-mal geändert.
Antworten