Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1461 connectés 

 


 Mot :   Pseudo :  
 
 Page :   1  2  3  4  5  6  7  8
Auteur Sujet :

[Topic Unique] Statistiques descriptives, inférentielles & dataviz

n°4909860
Herazor
Posté le 02-08-2016 à 17:01:32  profilanswer
 

Reprise du message précédent :
Y a des gens chauds en programmation de log-vraisemblance sur Stata parmi vous camarades ? :o

mood
Publicité
Posté le 02-08-2016 à 17:01:32  profilanswer
 

n°4909888
rastafia
sélavi
Posté le 02-08-2016 à 18:07:25  profilanswer
 


L'exemple que je donne est encore pire : il ne dit pas "je pense que le dé est truqué mais j'ai 5% de chances de me planter", il dit "je n'ai pas le droit d'affirmer que le dé est truqué, même en me laissant 5% de chances de me tromper".
 
Autrement dit, la conclusion est "on ne peut pas conclure".


Message édité par rastafia le 02-08-2016 à 18:10:17

---------------
Cantor est devenu fou
n°4909891
Dioscur
Posté le 02-08-2016 à 18:20:48  profilanswer
 

Techniquement on a le droit de rejeter l'hypothèse de non significativité si le alpha passe en dessous de 5%  ("on rejette H0" ) ce qui ne dit pas que c'est juste, ça dit juste que c'est extrêmement peu probable que ça soit faux.

 

Bref, p < 5% => "je garde"

 

c'est un axiome cherchez pas plus loin ; en stats c'est une certitude, les tests statistiques c'est rien, en plus c'est des probabilités.

 

------

 

les erreurs types 1 c'est les faux négatifs (calculables)
les erreurs type 2 c'est les faux positifs (non-calculables)

 

------

 

Focalisez surtout sur la spécification (quelles séries ?) le choix du modèle (regression ?) et la saleté de données (hétéroskédastiques ?) c'est ça le sujet des stats inférentielles.


Message édité par Dioscur le 03-08-2016 à 16:19:23

---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910011
Profil sup​primé
Posté le 03-08-2016 à 06:29:47  answer
 

:hello:  
Je vais essayer d'orienter un stage de master vers de l'analyse statistique (même si ce n'est pas du tout mon domaine de formation :o ). Du coup je passerai peut-être poser quelques questions aux experts  :)  
L'analyse probabiliste est très en vogue en tout cas. Même si certaines personnes sont très attachées aux méthodes déterministes :(

n°4910020
Dioscur
Posté le 03-08-2016 à 09:27:20  profilanswer
 

Salut rata !
 
T'as le master ESA de univ. Orléans (généraliste) qui a l'air pas mal, au vu de la précision des questions sur leur forum http://www.univ-orleans.fr/deg/masters/ESA/ (1,5k messages, dernier avant-hier)  
 
Sinon le forum du CIRAD (des agro ... sale) "statisticiens sur R" :
http://forums.cirad.fr/logiciel-R/ (368k messages, le dernier ce matin)  
 
J'ai demandé à leur modérations hier soir si c'était possible de faire des références croisées entre nos forums.
 
Je vous tiens au jus à ce sujet [:douste-blabla]

Message cité 1 fois
Message édité par Dioscur le 03-08-2016 à 11:59:29

---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910055
Profil sup​primé
Posté le 03-08-2016 à 11:42:46  answer
 

Dioscur a écrit :

Salut rata !

 

T'as le master ESA de univ. Orléans (généraliste) qui a l'air pas mal, au vu de la précision des questions sur leur forum http://www.univ-orleans.fr/deg/masters/ESA/ (1,5k messages, dernier avant-hier)

 

Sinon le forum du CIRAD (des agro ... sale) des "statisticiens sur R" :
http://forums.cirad.fr/logiciel-R/ (368k messages, le dernier ce matin)

 

J'ai demandé à leur modérateurs hier soir si c'était possible de faire des références croisées entre nos forums.

 

Je vous tiens au jus à ce sujet [:douste-blabla]

 

J'y rentre cette année au M1 ESA d'ailleurs :sol:

 

Merci pour le petit forum  :jap:

 

Pour revenir à l'alpha, ce qui est marrant c'est qu'à la base tu peux te dire avant de faire tes tests ton modèle "hmmm je vais prendre 5%" et tu te rends compte que tes résultats tournent à 7-8% pour rejeter l'hypothèse nulle, du coup tu te permets de pas trop rester à 5%, ça m'est arrivé cette année sur quelques travaux rendus, et notre prof le faisait souvent aussi. Dans un but éducatif ça passe, dans un but pro je sais pas.

Message cité 2 fois
Message édité par Profil supprimé le 03-08-2016 à 11:46:50
n°4910058
andressen
Posté le 03-08-2016 à 11:57:44  profilanswer
 


 
future élite de la nation  [:ticento:5]  
 
Franchement vu comment tas lair daimer l'économétrie tu vas kiffer le ESA je pense  [:cond:3]

n°4910059
Dioscur
Posté le 03-08-2016 à 12:06:53  profilanswer
 

je suis pas assez excellent pr me permettre de faire ça :D mais certains Pr. le font, d'après la légende, peut-être qu'ils ont assez de pif je sais pas


---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910061
HeisenberG​75
www.savewalterwhite.com
Posté le 03-08-2016 à 12:15:59  profilanswer
 

Je sais que la banque de france prend 8% pour certains modèles voir 10% des fois

 

Donc ça doit dépendre des services
5% c'est qd mm bien restrictif

 

Quand je fais des tests perso ue suis restrictif 5 ou 1%
Quand je veux virer des variables et selon le contexte je vais jusqu'à 8 ou 10

n°4910082
Darmstadti​um
Pipoteur grotesque
Posté le 03-08-2016 à 13:36:28  profilanswer
 


HeisenberG75 a écrit :

Je sais que la banque de france prend 8% pour certains modèles voir 10% des fois

 

Donc ça doit dépendre des services
5% c'est qd mm bien restrictif

 

Quand je fais des tests perso ue suis restrictif 5 ou 1%
Quand je veux virer des variables et selon le contexte je vais jusqu'à 8 ou 10


C'est une méthode bizarre ça quand même, assez datée je dirais.

 

Ce qu'on m'a appris et que je trouve beaucoup plus logique : je fais mon test statistique et je reporte la valeur pivotale (la p-value du test).

 

De toute façon, pour tout seuil inférieur à la p-value on ne rejettera pas l'hypothèse nulle tandis que pour tout seuil supérieur on le fera. Donc autant reporter la p-value et voir par la suite si c'est un seuil acceptable pour la décision à prendre, c'est de toute façon le seuil le plus bas que l'on peut prendre pour rejeter H0.

Message cité 2 fois
Message édité par Darmstadtium le 03-08-2016 à 13:37:32

---------------
Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets
mood
Publicité
Posté le 03-08-2016 à 13:36:28  profilanswer
 

n°4910101
HeisenberG​75
www.savewalterwhite.com
Posté le 03-08-2016 à 14:19:54  profilanswer
 

Darmstadtium a écrit :


C'est une méthode bizarre ça quand même, assez datée je dirais.

 

Ce qu'on m'a appris et que je trouve beaucoup plus logique : je fais mon test statistique et je reporte la valeur pivotale (la p-value du test).

 

De toute façon, pour tout seuil inférieur à la p-value on ne rejettera pas l'hypothèse nulle tandis que pour tout seuil supérieur on le fera. Donc autant reporter la p-value et voir par la suite si c'est un seuil acceptable pour la décision à prendre, c'est de toute façon le seuil le plus bas que l'on peut prendre pour rejeter H0.

 

Je comprends pas ton message

 

Bien sur qu'on affiche la pvalue après c'est le seuil qui peut varier selon si tu veux être très restrictif ou pas

 

Par exemple pour un test d'indépendance BDS tu as plusieurs dimensions et c'est mieux d'adapter ton seuil à ta dimension (qui est déjà en soit un facteur qui te permet d'être restrictif ou non)

n°4910127
Profil sup​primé
Posté le 03-08-2016 à 15:25:55  answer
 

HeisenberG75 a écrit :

Je sais que la banque de france prend 8% pour certains modèles voir 10% des fois
 
Donc ça doit dépendre des services
5% c'est qd mm bien restrictif
 
Quand je fais des tests perso ue suis restrictif 5 ou 1%
Quand je veux virer des variables et selon le contexte je vais jusqu'à 8 ou 10


 
J'ai pas trop de notion d'éco mais pour ce genre de modèles c'est l'incertitude sur les variables où le choix d'une hypothèse plus "restreinte" qui fait augmenter l'erreur?
 
Pour le pib par exemple il me semble facile de dire que la croissance sera comprise entre -5% et 5% avec 99.X% de certitude, même si ce n'est pas très utile :o .

n°4910132
Dioscur
Posté le 03-08-2016 à 15:31:28  profilanswer
 

heu ... on parle toujours de la significativité statistique là ? (/ex. pr coeffs d'une régression & tests ala white/bp)

 

https://fr.wikipedia.org/wiki/Signification_statistique


Message édité par Dioscur le 03-08-2016 à 15:50:46

---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910139
HeisenberG​75
www.savewalterwhite.com
Posté le 03-08-2016 à 15:47:20  profilanswer
 

Moi je parle d alpha :o

n°4910140
toto408
free porn
Posté le 03-08-2016 à 15:47:35  profilanswer
 

Ces 5% sont assez standarts, mais certains domaines demandent bien plus: par exemple la récente fausse découverte d'une particule au LHC avec une p-value de 10e-6: http://resonaances.blogspot.ch/201 [...] gover.html


---------------
OverClocking-Masters
n°4910141
Dioscur
Posté le 03-08-2016 à 15:48:54  profilanswer
 

HeisenberG75 a écrit :

Moi je parle d alpha :o


 
 [:ttienne:3]


---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910144
Profil sup​primé
Posté le 03-08-2016 à 15:55:13  answer
 

toto408 a écrit :

Ces 5% sont assez standarts, mais certains domaines demandent bien plus: par exemple la récente fausse découverte d'une particule au LHC avec une p-value de 10e-6: http://resonaances.blogspot.ch/201 [...] gover.html


C'est aussi plus facile avec une science dite "exacte".


 :kaola:  

n°4910148
toto408
free porn
Posté le 03-08-2016 à 15:59:02  profilanswer
 

 

Toutafay :jap:

 

J'essaie d'apporter un peu de vraie science à ce topic d'économistes / socialistes sociologistes :o


Message édité par toto408 le 03-08-2016 à 15:59:23

---------------
OverClocking-Masters
n°4910153
Dioscur
Posté le 03-08-2016 à 16:08:31  profilanswer
 

 

:kaola:  :kaola:

 


Pour ceux du fond :

 

alpha = seuil de significativité
p = résultat du test

 

si p<alpha : rejet de H0 -> acceptation de H1
si p>alpha : non-rejet (acceptation) de H0 -> rejet de H1

 

faites hyper attention à ce que sont H0 & H1 ... c'est différent pour chaque test.

Message cité 1 fois
Message édité par Dioscur le 03-08-2016 à 16:16:53

---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910154
HeisenberG​75
www.savewalterwhite.com
Posté le 03-08-2016 à 16:11:22  profilanswer
 

Dioscur a écrit :

 

:kaola:

 


Pour ceux du fond :

 

alpha = seuil de significativité
p = résultat du test

 

si p<alpha : rejet de H0 -> acceptation de H1
si p>alpha : non-rejet de H0 -> acceptation de H1

 

faites hyper attention à ce que sont H0 & H1 ... c'est différent pour chaque test.


 Fail :)

n°4910156
Dioscur
Posté le 03-08-2016 à 16:12:08  profilanswer
 
n°4910162
HeisenberG​75
www.savewalterwhite.com
Posté le 03-08-2016 à 16:23:58  profilanswer
 


Ce que tu décris c'est la règle de décision entre H0 et H1 de Neyman Pearson mais je sais plus ou j'avais lu que pour certains statisticiens (Fisher ?) rejeter H0 n'est pas équivalent à accepter H1

 

Ça peux paraître chelou mais en gros quand tu fais ton test si tu rejettes H0 tu peux rien conclure d'autre
Faut changer tes données et retester H0

 

C'est presque de la philo après :o

Message cité 2 fois
Message édité par HeisenberG75 le 03-08-2016 à 16:25:48
n°4910212
Dioscur
Posté le 03-08-2016 à 17:34:17  profilanswer
 

Non effectivement, rejeter H0 ce n'est pas accepter H1, ce sont deux opérations différentes qui se succèdent.

 

Si tu choisi un alpha à 5% (le seuil de significativité statistique, différent dans chaque discipline) ... et si p<alpha alors tu rejettes H0 avec 5% de chances de faire une erreur de type 1 (5% de chance de faire un faux négatif) ensuite tu peux accepter H1 ... avec une chance inquantifiable (beta) de faire une erreur de type 2 (faux positif).

 

Après faut garder en tête que ce sont d'excellents tests. C'est comme le dicton à propos des cons plein de certitudes et des intelligents plein de doutes : ce sont des tests hyper-performants qui ont des défauts.

 

C'est comme ... rien n'est juste en science, techniquement. C'est juste pas encore falsifié. Toutes les théories sont fausses en fait. Jamais vous ne produirez un modèle juste.

 

... Ceci dit les types pour qui vous bossez ils s'en foutent hein, de tout ça. Pour eux vous produisez des certitudes.


Message édité par Dioscur le 03-08-2016 à 22:34:35

---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910224
rastafia
sélavi
Posté le 03-08-2016 à 17:41:35  profilanswer
 

HeisenberG75 a écrit :


Ce que tu décris c'est la règle de décision entre H0 et H1 de Neyman Pearson mais je sais plus ou j'avais lu que pour certains statisticiens (Fisher ?) rejeter H0 n'est pas équivalent à accepter H1
 
Ça peux paraître chelou mais en gros quand tu fais ton test si tu rejettes H0 tu peux rien conclure d'autre
Faut changer tes données et retester H0
 
C'est presque de la philo après :o


C'est ce que j'appelle les maths normandes.
 
Si tu lances 1000 fois une pièce et que tu obtiens :
 
- 335 fois pile et 665 fois face, tu peux affirmer que la pièce est truqués au seuil de 99.99999999999999999999999%
Tu as la quasi certitude que la pièce est truquée
 
- 460 fois pile et 540 fois face, tu peux affirmer que la pièce est truquée au seuil de 95%
Il est raisonnable de penser que la pièce est truquée si tu acceptes de te planter une fois sur 20
 
- 470 fois pile, tu ne peux pas affirmer que la pièce est truquée au seuil de 95%
Si tu n'acceptes pas de te planter plus qu'une fois sur 20, tu ne peux rien conclure.
("On ne rejette pas l'hypothèse que la pièce n'est pas truquée", maths normandes
!)
 
- 470 fois pile, tu peux affirmer que la pièce est truquée au seuil de 90%
Si tu acceptes de te planter une fois sur 10, tu peux penser que la pièce est truquée.
 
- 493 fois pile, tu peux affirmer que la pièce est truquée au seuil de 20%
Si tu acceptes de te planter huit fois sur 10, tu peux penser que la pièce est truquée.
(Cela n'a concrètement aucun sens)
 
 
Dîtes moi si je me trompe hein, je ne suis pas statisticien.
 
Voici les résultats que j'ai trouvés :  
intervalle de fluctuation à 99.99999999999999999999999% : [336 ; 664]
intervalle de fluctuation à 99% : [459 ; 541]
intervalle de fluctuation à 95% : [469 ; 531]
intervalle de fluctuation à 20% : [494 ; 506]


Message édité par rastafia le 03-08-2016 à 17:49:35

---------------
Cantor est devenu fou
n°4910228
Dioscur
Posté le 03-08-2016 à 17:45:55  profilanswer
 

Je pense que tu te rapproches beaucoup. C'est chiant les test-stats parce que c'est invulgarisable en fait.

 

C'est juste une construction théorique étrange [:le fleau]


Message édité par Dioscur le 03-08-2016 à 17:55:29

---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910247
Rasthor
Posté le 03-08-2016 à 18:05:07  profilanswer
 

Darmstadtium a écrit :


C'est une méthode bizarre ça quand même, assez datée je dirais.
 
Ce qu'on m'a appris et que je trouve beaucoup plus logique : je fais mon test statistique et je reporte la valeur pivotale (la p-value du test).
 
De toute façon, pour tout seuil inférieur à la p-value on ne rejettera pas l'hypothèse nulle tandis que pour tout seuil supérieur on le fera. Donc autant reporter la p-value et voir par la suite si c'est un seuil acceptable pour la décision à prendre, c'est de toute façon le seuil le plus bas que l'on peut prendre pour rejeter H0.


http://2.bp.blogspot.com/-MV2FqEWSSts/VKhmbaeTghI/AAAAAAAABDY/fY8XMi3H-ik/s1600/55580588.jpg

n°4910260
CobbDougla​s
Posté le 03-08-2016 à 18:41:14  profilanswer
 

on en parle aussi des tests de reproductabilité ? :o

n°4910277
Dioscur
Posté le 03-08-2016 à 19:47:24  profilanswer
 

Les t-stats c'est pour les cinglés, cherchez pas.


---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910295
Vitelis
Posté le 03-08-2016 à 20:26:10  profilanswer
 

Il est cool ce topic :o


---------------
Mdr t ki
n°4910370
Profil sup​primé
Posté le 03-08-2016 à 22:19:43  answer
 

HeisenberG75 a écrit :


Ce que tu décris c'est la règle de décision entre H0 et H1 de Neyman Pearson mais je sais plus ou j'avais lu que pour certains statisticiens (Fisher ?) rejeter H0 n'est pas équivalent à accepter H1

 

Ça peux paraître chelou mais en gros quand tu fais ton test si tu rejettes H0 tu peux rien conclure d'autre
Faut changer tes données et retester H0

 

C'est presque de la philo après :o

 

http://images.slideplayer.fr/2/495931/slides/slide_10.jpg

 

Ce tableau la première fois il m'a donné des cauchemards, surtout quand notre prof de statistiques a tenté de nous l'expliquer en vulgarisant au max.

 

Mais c'est vrai que dire que tu peux accepter H0, ça veut pas dire que H1 est faux, ça traumatise un peu au début, t'as l'impression que tu joues à un jeu où on se fout de ta gueule.

 

Genre ça serait comme dire "ce crayon il est bleu mais attention ça veut pas dire qu'il est pas rouge".


Message édité par Profil supprimé le 03-08-2016 à 22:21:05
n°4910710
Dioscur
Posté le 04-08-2016 à 15:24:19  profilanswer
 

CobbDouglas a écrit :

on en parle aussi des tests de reproductabilité ? :o

 

------

 

Topic rule #2 : seuls ceux qui le sentent répondent en essayant de vulgariser au max.
Internet rule #8 : There are no real rules about posting

 


------

 

=> sujet sur la comparaison de différents modèles en compétition, en passant par le Critère d'Information d'Aikaike  

 

https://fr.wikipedia.org/wiki/Crit% [...] d%27Akaike (1973)
http://forums.cirad.fr/logiciel-R/ [...] f=11&t=221

 

laïus

 

J'ai appris l'existence du AIC en apprenant la méthode Box-Jenkins destinée à définir les (p,d,q) les plus efficaces dans la fit d'un modèle ARIMA. (principe dit de parcimonie : on cherche le AIC le plus réduit en comparant x modèles avec des (pdq) différents, l'objectif est de faire une ~peréquation entre le AIC réduit au max et les pqd réduits au max aussi). Nota : Les arima sont des modèles de prédiction de séries temporelles saisonnalisées.

 

Apparemment : il est possible de généraliser cette approche pour comparer plusieurs modèles en compétition.

Message cité 2 fois
Message édité par Dioscur le 04-08-2016 à 22:49:16

---------------
le topic stats  ! http://forum.hardware.fr/forum2.ph [...] w=0&nojs=0
n°4910950
HeisenberG​75
www.savewalterwhite.com
Posté le 04-08-2016 à 20:47:02  profilanswer
 

Dioscur a écrit :

 

------

 

Topic rule #2 : seuls ceux qui le sentent répondent en essayant de vulgariser au max.
Internet rule #8 : There are no real rules about posting

 


------

 

=> sujet sur la comparaison de différents modèles en compétition, en passant par le Critère d'Information d'Aikaike  

 

https://fr.wikipedia.org/wiki/Crit% [...] %27Akaike. (1973)
http://forums.cirad.fr/logiciel-R/ [...] f=11&t=221

 

laïus

 

J'ai appris l'existence du AIC en apprenant la méthode Box-Jenkins destinée à définir les (p,d,q) les plus efficaces dans la fit d'un modèle ARIMA. (principe dit de parcimonie : on cherche le AIC le plus réduit en comparant x modèles avec des (pdq) différents, l'objectif est de faire une ~peréquation entre le AIC réduit au max et les pqd réduits au max aussi). Nota : Les arima sont des modèles de prédiction de séries temporelles saisonnalisées.

 

Apparemment : il est possible de généraliser cette approche pour comparer plusieurs modèles en compétition.

 

effectivement tu peux regarder AIC dans la méthode de Box Jenkins mais pourquoi AIC et pas BIC ? ou HQ ? ou Likehood ratio (qui est un test et pas un critère) ?
Ces critères d’information (AIC/BIC/HQ) sont basés sur l’information de "Kullback et Leibler" -> en gros c'est des estimateurs de l’écart entre f_0 la densité inconnue des observations dont on dispose et f_p la densité associée au modèle AR(p). (f_0 peut être en dehors de la structure des AR(p)...)
pour faire simple : tu cherches à minimiser l’écart entre les deux densités f_0 et f_p, donc tu vas choisir les estimations qui minimisent la valeur de des critères
perso quand je fais ce genre de truc je sors tous les critères/tests

 

exemple :
http://reho.st/self/19ec2184727ebe71b4ddf5289a51eb79787410d8.png

 

là tu vois que si tu avais choisi HQ tu prendrais un lag de 3 mais AIC, LR et FPE te donnent un lag 38
perso je prends toujours le lag max au début

 

pour comparer deux modèles candidats tu peux aussi utiliser :
Le RMSE (Root Mean Squared Error), MAE (Mean Absolute Error) , MAPE (Mean Absolute Percentage Error), Theil Inequality Coefficient etc
là pareil je sors un tableau avec plein d'indicateur et tu regardes si un modèle est plus performant sur la majorité des indicateurs


Message édité par HeisenberG75 le 04-08-2016 à 20:48:25
n°4911032
Profil sup​primé
Posté le 04-08-2016 à 22:10:44  answer
 

Dioscur a écrit :


 
------
 
Topic rule #2 : seuls ceux qui le sentent répondent en essayant de vulgariser au max.
Internet rule #8 : There are no real rules about posting
 
 
------
 
=> sujet sur la comparaison de différents modèles en compétition, en passant par le Critère d'Information d'Aikaike  
 
https://fr.wikipedia.org/wiki/Crit% [...] %27Akaike. (1973)
http://forums.cirad.fr/logiciel-R/ [...] f=11&t=221
 
laïus
 
J'ai appris l'existence du AIC en apprenant la méthode Box-Jenkins destinée à définir les (p,d,q) les plus efficaces dans la fit d'un modèle ARIMA. (principe dit de parcimonie : on cherche le AIC le plus réduit en comparant x modèles avec des (pdq) différents, l'objectif est de faire une ~peréquation entre le AIC réduit au max et les pqd réduits au max aussi). Nota : Les arima sont des modèles de prédiction de séries temporelles saisonnalisées.
 
Apparemment : il est possible de généraliser cette approche pour comparer plusieurs modèles en compétition.


 
Pour choisir ton p et q, tu peux aussi passer par l'eacf de tes données. http://faculty.chicagobooth.edu/ru [...] 0/lec9.pdf
 
C'est graphique et c'est assez facile, après c'est pas méga exact non plus.
 
Mais après en effet, pour comparer lequel est le meilleur, le critère AIC reste assez solide, mais putain c'est tellement chiant à faire :lol: Si j'avais pas été flemmard, j'aurais fait une fonction qui permet d'extraire les AIC de mes Arima et ensuite me sortir le meilleur  modèle, ça prend deux secondes à faire sous R ce genre de conneries.


Message édité par Profil supprimé le 04-08-2016 à 22:12:49
n°4911237
Profil sup​primé
Posté le 05-08-2016 à 15:27:00  answer
 

Bonjour, on m'a demande de poster ça ici, parait que ça pourrait aider l'un d'entre vous :

n°4912239
Rasthor
Posté le 09-08-2016 à 23:43:37  profilanswer
 

Comment débuter dans la Data Science ?

 

http://jereze.com/fr/blog/debuter-data-science

 

Becoming a Data Scientist – Curriculum via Metromap

 


http://reho.st/self/560a24dcf25f71e1b2de92daa92758d12a3fbb6c.png

Message cité 2 fois
Message édité par Rasthor le 10-08-2016 à 00:44:34
n°4912240
toto408
free porn
Posté le 10-08-2016 à 00:05:01  profilanswer
 

Rasthor a écrit :

Comment débuter dans la Data Science ?

 

http://jereze.com/fr/blog/debuter-data-science

 

Becoming a Data Scientist – Curriculum via Metromap

 

(Cliquez sur l'image pour la voir en grand)
http://reho.st/self/560a24dcf25f71 [...] 3fbb6c.png


Cliquer sur l'image ne fait rien du tout :o


---------------
OverClocking-Masters
n°4912720
Magicpanda
Pushing the envelope
Posté le 11-08-2016 à 14:10:17  profilanswer
 

Drap :o  
 
Je suis IR CNRS donc je fait ca toute la journée !


---------------
" Quel est le but du capital ? Le but du capital c'est produire pour le capital. L'objectif, lui, est illimité. L'objectif du capital c'est produire pour produire." - Deleuze || André Gorz - Vers la société libérée
n°4913137
Rasthor
Posté le 13-08-2016 à 10:16:34  profilanswer
 

Bonjour a tous,

 

Une question basique, dont j'ai une reponse (je crois), mais il y a probablement d'autres facons de faire mieux:

 

J'ai plein d’échantillons A, B, C, etc....

 

Pour chaque echantillons, j'ai plein de valeurs: y, X1, X2, X3, X4, X5, etc....

 

J'aimerais voir si je peux expliquer Y par les valeurs X1, X2, X3.

 

Donc il faut faire une régression lineaire multiple ou un ANOVA (ce qui est exactemenet la meme chose).

 

Mais y'a-t-il mieux ?

 

Maintenant, est-ce qu'il y aurait aussi moyen de faire des groupes (categories) dans mes echantillons A, B, C... et de voir si ces groupes peuvent ameliorer le modele ? Genre les coefficients differents dans chaque groupe ?

 


Merci. :jap:


Message édité par Rasthor le 13-08-2016 à 10:17:06
n°4918073
Rasthor
Posté le 03-09-2016 à 19:53:29  profilanswer
 

Dites-voir, j'aurais besoin d'une opinion.
 
J'ai une table 2x2 avec des valeurs de comptage:

       |  Fruits | Légumes
Rouge  |    1738 |     824
Vert   |    1885 |    1042


 
Pour savoir si j'ai un excès ou depletion quelque part, je lance un Fisher's exact test. Ca me donne un odd ratio de 1.16 et une p-value de 0.008. Donc j'en conclus qu'il y a plus souvent des fruits de couleur rouge qu'attendu.
 
Maintenant, j'ai une table 2x3:

       |  Fruits | Légumes
Rouge  |    1738 |     824
Jaune  |    1276 |     727
Vert   |    1885 |    1042


 
J'aimerais savoir si dans chaque cellule, le nombre attendu est normal, ou different que normal. Je ne peux pas appliquer le Fisher's exact test directement sur la table car il ne marche que sur une table 2x2.  
 
Par contre, un truc que j'ai parfois vu est de contracter la table pour chaque cellule, faire le Fisher's test et de reporter le odd ratio et la p-value pour chaque cellule. Genre comme ceci pour la premier cellule:
 
Cellule = 1738
Ligne = 824 (somme de la ligne - cellule)
Colonne = 1376+1785 = 3162  (somme de la colonne - cellule)
Table = 727+1142 = 1868 (somme de la matrix - (colonne+ligne+cellule))
 
mat <- matrix(c(1738, 3162, 824, 1868), nrow=2)
fisher.test(mat)
 
=> Odd ratio = 1.24, p-value = 1.801e-05
 
 
Puis ensuite répéter l’opération pour les cinq autres cellules, reporter une table avec les six odd ratios et p-values obtenues, et ajuster le seuil de significativité alpha a 0.05/6 (Bonferroni correction, car six cellules).
 
1) Qu'est-ce que vous pensez ?
2) C'est erroné de faire comme ca ?
3) Si c'est juste, ca porte un nom cette procédure ?
4) Y'aurait une autre facon plus elegante de faire ca ?
 
 

n°4920798
Rasthor
Posté le 16-09-2016 à 16:17:03  profilanswer
 

Personne pour mon problème ci-dessus ? :O

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  6  7  8

Aller à :
Ajouter une réponse
 

Sujets relatifs
[Topic Unique] Licence LEA (Langues Etrangères Appliquées)[ Topic unique ] Stage à l'étranger
[Topic unique] Bac 2k13 - 2k14 ===[Topic Unique] Concours A/A+ (Rejoignez la clownance !)
Master économétrie et statistiques appliquées[Topic Unique] Magistère Banque Finance - Université Panthéon-Assas
[Topic Unique] Master Économétrie et Statistiques Appliquées - Orléans[Topic Unique]Bloquer son année universitaire
[Topic Unique] ROUEN BUSINESS SCHOOL MASTERE Spécialisé FINANCE 
Plus de sujets relatifs à : [Topic Unique] Statistiques descriptives, inférentielles & dataviz


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR