Vad är nytt i GeneXproTools 5

Vad är nytt i GeneXproTools 5 av mångfald

Stödet för kategoriska data som och saknade värden är en av de viktigaste nya tillägg till version 5. GeneXproTools stöder nu kategoriska variabler och saknade värden, från data loading till kodgenerering, avsevärt förbättra effektiviteten och kvaliteten i modelleringsprocessen.

Nästa större betydelse är det nya stödet för dataset förvaltning. med olika datamängdsseparationsteknik och underprovtagningsplaner. Inklusive säckväv och mini-satsvis vilka är nödvändiga för att generera goda ensembler och bearbetning av stora datamängder.

Också oerhört viktigt är den nya multifunktionella Data Panel där du kan analysera inte bara din invariabler men också din härledda variabler och alla dina modeller. Nu med den nya datapanelen du kan korsa analysera alla dessa olika typer av variabler mellan olika datamängder.


Den nya data Panelen stöder också rekord analys och visualisering. med ett brett sortiment av verktyg och analyser såsom felanalys och skiv prototyper.

Också viktigt i den nya versionen är en fullständig integrering av Logistisk tillbakagång. med dedicerad lämplighetsfunktioner och genereringen av den logistisk regressionsmodell kod i alla stödda programmeringsspråk.

Också större i GeneXproTools 5,0 är införandet av favorit Statistik för alla modellerings kategorier, så att du kan välja modeller med hjälp av statistik som du väljer, inklusive området under ROC-kurvan, Korrelationskoefficienten, RMSE, och många fler.

Också större i version 5 är stödet för ensemble utplacering av dataskyddat läge. vilket är viktigt för utbyggnaden av stora ensembler eller GEP skogar.

Det finns andra stora förbättringar i version 5, såsom nya genetiska operatörer och modelleringsstrategier. ny bindningsfunktioner och utvecklingsbara tröskelvärden avrundnings. 100+ nya lämplighetsfunktioner och multinomial Klassificering & Logistisk tillbakagång. variabel vikt för alla genererade modeller och mycket mer. Listan över små förbättringar är enorm och under hittar du också en kortfattad beskrivning av de viktigaste av dem.

Nedan följer en mer detaljerad beskrivning av de nya funktionerna. Du kan också titta på en video att införa några av de viktigaste funktionerna i den nya versionen.

Nya Multifunktionell datapanelen

Den nya Data Panel går utöver en enkel plattform för att analysera och visualisera indata. Förutom att tillåta analys och visualisering av invariabler. nu också tillåter visualisering och analys av alla dina modeller och härledda variabler. ger dig tillgång till en rik väv av analyser mellan alla dessa typer av variabler och mellan olika datamängder.

Den myriad av analyser som stöds av den nya datapanelen innehåller spridningsdiagram och regressionsanalys mellan alla möjliga par av variabler (invariabler, modeller och härledda variabler); histogram och sammanfattande statistik för alla variabler och mellan olika datamängder; annorlunda linjediagram för outlier detektering och modellanalys ; utvärdering av variabel vikt och visning av variabel vikt diagrammet för alla modeller; och så vidare.

Den nya data Panelen stöder också omfattande skiv analyser. så att du kan studera olika typer av poster med olika diagram och surfar verktyg. Till exempel kan du nu jämföra varje post med olika skiv prototyper För att få inblick i både dina data och dina modeller. Genom att välja just den outliers eller den felklassificerade register att bläddra, kan du nu också göra felanalys på datapanelen.

Variabla diagram och analys

Nedan är ett galleri av de nya listorna för datapanelen för variabel visualisering & analys.

De Sekventiell Distribution Diagram. med dess standardavvikelse linjer och medellinje, är idealisk för att upptäcka extremvärden. De Bivariate Linjediagram. med sorteringsalternativ och Visa normaliserade alternativet är ett mycket flexibelt och användbart verktyg för att jämföra två valfria variabler.

De scatter Plot gör det möjligt att mycket snabbt visualisera sambandet mellan alla möjliga par av variabler, inklusive invariabler, modeller och härledda variabler.

De Histogram gör det möjligt att mycket snabbt analysera fördelningen av alla variabler (invariabler, modeller och härledda variabler), och jämföra dem mellan olika datamängder.

De Statistik Diagram. som omfattar 9 olika diagram för 9 olika sammanfattande statistik (min, max, medelvärde, median, standardavvikelse, R-kvadrat, korrelationskoefficient, lutnings- och skärnings), kan du snabbt visualisera och jämföra sammanfattande statistik för alla dina variabler (invariabler , modeller och härledda variabler) och för alla dina datamängder.

De Variabel Betydelsen Diagram visar på vikten av alla variabler i dina modeller, inklusive vikten av härledda variabler.

Den nya belysa funktionalitet av den nya datapanelen ger ytterligare en dimension till datavisualisering och analys. Genom att lyfta fram vissa typer av poster, såsom felklassificeringar i klassificering och Logistisk regressions eller modell outliers i Regression och tidsserier förutsägelse, kan du nu snabbt förstå och visualisera nya mönster i alla variabler och modeller.

Spela diagram och analys

Nedan följer ett galleri med olika skiv analyser Du kan enkelt utföra i den nya datapanelen.

Genom att kombinera alla Spela Diagram med olika surfning alternativ. GeneXproTools kan du nu utföra olika register analyser och beräkningar, inklusive felanalys. rekord prototyping och sammanfattande statistik mellan olika variabler (invariabler, modeller och härledda variabler) och datamängder.

Stöd för kategoriska variabler och saknade värden

GeneXproTools stöder nu kategoriska variabler och 50 + olika typer av saknade värden. ersätta dem automatiskt under data lastning, men gör att du kan välja olika mappningar både för de kategorier och saknade värden.

Dessutom GeneXproTools utökar stödet för kategoriska och saknade uppgifter i hela modelleringsprocessen, genererar modellkod som stöder också kategoriska variabler och saknade värden, erbjuder dig en mycket mer robust och bekväm plattform för modell design och driftsättning. Nedan är ett exempel på C ++ av en klassificeringsmodell med både kategoriska variabler och saknade värden.

Stöd för Multinomial Klassificering & Logistisk tillbakagång

GeneXproTools tillhandahåller nu en plattform för hantering flera klasser i klassificering och Logistisk regressions, så att du kan enkelt ställa olika sub-klassificering uppgifter för varje klass i responsvariabeln, utan att du behöver för att förbereda och ladda olika datamängder för varje klassificering eller Logistisk regressions problem. Genom klass Sammanslagning & diskretisering fönstret kan du peka ut klassen av intresse och skapa modeller för varje under uppgift då, hålla dem under en enda GEP fil eller skapa n olika filer för n klasser.

Stöd för Data Normalisering

GeneXproTools kan du nu normalisera dina numeriska variabler, inte bara för tillämpningen av visualisering och analys utan också för modell design. Normaliseringstekniker som stöds av GeneXproTools inkluderar Standardisering. 0/1 Normalisering och Min / Max Normalisering.

GeneXproTools igen skapar modellkod för poängsättning och distribution som även stöder data normalisering. Nedan är ett exempel på Pytonorm av en logistisk regressionsmodell skapad med hjälp av data standardiserade i GeneXproTools miljö.

Dataset Partitionera och undersampling

Nu i version 5.0 kan du hantera dina datauppsättningar inne GeneXproTools, eftersom det ger viktiga verktyg för att enkelt dela dina data i utbildning och validering / provdatamängder. Provtagnings som får stöd GeneXproTools inkluderar Odds / Evens delning, välja olika partitioner och slumpmässig Shuffle (Stickprov utan ersättning). För alla modellerings kategorier ger GeneXproTools också användbara standard optimerade för effektivitet och bra modell generalisering.

Dessutom GeneXproTools stöder även undersamplings av både utbildning och valideringsdatamängder, genomför flera sub-provtagningsplaner, inklusive säckväv och mini-batch. som är respektive viktiga verktyg för att skapa slumpmässiga skogar (Mer lämpligt kallas GEP skogar ) Och att hantera stora datamängder. Under provtagning av validerings dataset har också flera program, inklusive reservera en del av valideringsuppsättning för testning och beräkning av korsvaliderings noggrannhet av dina modeller.

De undersamplings av både utbildning och valideringsdatamängder sker i inställningar Panel och omfattar: Top n, Nedre n övre halvan, nedre halvan, enstaka fall, även fall, Random som blandas, Balanced Random, och Ballanced blandade. Den balanserade system finns endast för klassificering, logistisk regression och logiksyntes.

Stöd för GEP filer som datakälla

Vi har nu lagt till stöd för laddar data från GEP-filer. så att du kan välja antingen utbildning eller validering / test dataset eller de ursprungliga uppgifterna, vilket i detta sammanhang definieras som en förening av utbildning och validering / provdatamängder. I båda fallen är det ursprungliga rådata, med kategoriska variabler och saknade värden om de finns, som laddas i GeneXproTools.

Dessutom, Tidsserie Prediction GEP filer kan också användas som källdata för Regression, tidsserier Prediction, klassificering och Logistisk regressions körs så att du enkelt skapa alla typer av GEP körs med hjälp av transformerade tidsserier som invariabler.

Tillhandahåller nu GeneXproTools sammanfattande statistik för alla ingångsvariabler, modeller och härledda variabler. De sammanfattande statistik visas i statistik rapport på datapanelen. Dessutom GeneXproTools visar också sammanfattande statistik (min, max, medelvärde, median, standardavvikelse, korrelationskoefficient, R-kvadrat, lutning och skärningspunkt) grafiskt i Statistik Diagram.

GeneXproTools utvärderar också sammanfattande statistik för de poster. ger enkla sätt att jämföra olika typer av poster med skiv prototyper. Till exempel, genom att besöka bara felklassificerad registrerar denna statistik och visualiseringsverktyg är avgörande för felanalys.

outlier Detektion & avlägsnande

I datapanelen GeneXproTools erbjuder nu olika verktyg för outlier detektering. inklusive den nya Scatter Plot och sekventiell Distribution diagram, som nu visar både medellinje och standardavvikelse linjer för enkel detektion av avvikande värden.

Dessutom för Sekventiell Distribution Diagram. GeneXproTools kan du också kopiera index för alla extremvärden för den aktuella variabeln genom att välja Kopiera Outlier ID (3 Sigma) i snabbmenyn.

De utanförliggande index kan sedan klistras in direkt i den Radera poster Fönster för enkel borttagning av alla extremvärden.

GeneXproTools kan du snabbt analysera och visualisera korrelation mellan alla möjliga kombinationer av variabler i Data Panel. inklusive invariabler, modeller och härledda variabler. Genom scatter Plot och statistik rapport av datapanelen du har tillgång till regressionslinje och regressionsekvationen. de korrelationskoefficient och R-kvadrat för alla par av variabler.

GeneXproTools kan du nu göra felanalys i Data Panel. Genom att välja olika register för att bläddra, inklusive felaktig klassificering register och extremvärden, kan GeneXproTools dig att analysera dessa poster med olika diagram för att jämföra dem med andra register och spela in prototyper.

GeneXproTools beräknar nu och visar betydelse av alla variabler för alla dina modeller. De Variabel Betydelsen Diagram är tillgänglig via Statistik Diagram på datapanelen. Genom att välja modellvariabler i datakombinationsrutan, kan du snabbt komma åt variablerna i varje modell och deras relativa betydelse. Den rörliga betydelse beräknas för alla modeller GeneXproTools genererar, inklusive regressionsmodeller, klassificering och logistiska regressionsmodeller och tidsserier prognosmodeller.

GeneXproTools utför nu residualanalys för alla regressionsmodeller, inklusive tidsserier prognosmodeller. De Förbättringar Plot är tillgänglig både i Run Panel och resultat Panel.

Ny Logistic Regression Kategori

Logistik Regression Framework nu genomförs som en självständig kategori, med sin egen uppsättning av lämplighetsfunktioner, visualiseringsverktyg och kodgenerering.

Totalt 60 nya träningsfunktioner för logistisk regression inklusive ROC Mät, Rank Mät, Maximum Likelihood, Gångjärn Loss, Positiv Correl, R-kvadrat, Dual marginal och F Mät, bara för att nämna några. De flesta av dessa lämplighetsfunktioner är flera mål och inkludera olika justerbara parametrar såsom kostnaderna matris, antalet fack hänvisnings enkla modeller, lägre och övre gränser för modellen utgång, sparsamhet tryck och variabelt tryck.

Nu i Run Panel. för upp till 1000 poster i träningsdata, har du tillgång till 6 nya sjökort för modell design och visualisering. Dessa nya sjökort inkluderar klassificering Tapestry. tre Binomial Fit Charts med alternativ för att visa både rundningen tröskeln och felklassificeringar, de ROC Curve. och sofistikerade Klassificering Scatter Plot som är en annan Gepsoft vackra innovation. I galleriet nedan är samma logistisk regressionsmodell som analyseras med hjälp av sex modellanpassningen diagram över Run Panelen.

i resultat Panel GeneXproTools visar nu samma modell passande diagram visar i Run panelen, men nu för alla poster i tränings / valideringsdatamängder. Dessutom för Binomial Fit diagram, GeneXproTools kan du rita sannolikheten [1] förutom rå modellens resultat.

i Tabell av Resultat Panel nu GeneXproTools visar Sannolikhet [1] och den Troligtvis Klass utöver Rå Modell Effekt.

Också viktigt är den nya uppsättningen av statistik utvärderas i resultat Panel. som nu omfattar klassificering Noggrannhet & Fel, känsligheten & Specificitet, det positiva prediktiva värdet & Negativt prediktivt värde, Recall & Precision, Korrelationskoefficient & R-kvadrat, Jaccard Likhet, Matthews Korrelationskoefficienten, F1 Mät och området under ROC kurvan.

Samma uppsättning av statistik i historia Panel för modell och ensemble val genom Favorit Statistic Window.

Nu genererar GeneXproTools den hela koden för logistisk regressionsmodell. Dessutom GeneXproTools nu låter dig välja vilken typ av produktion du är mest intresserad av: modellkoden för att förutsäga Sannolikhet [1]. de Troligtvis Klass eller den Rå Modell Effekt.

Denna nya modalitet för kodgenerering finns tillgänglig under modell poäng i scoring Panel och även under Modell & Ensemble Distribution till Excel.

viktigt är också att i Data Panel. i syfte att modell visualisering och analys, kan du också välja någon av dessa 3 typer av modellens resultat: Sannolikheten [1], den mest sannolika klass eller Raw Model Output.

Modell Bläddra i Run Panel

Vi har nu lagt modell navigering i Run Panel. så nu kan du gå fram och tillbaka analysera och visualisera dina modeller, inte bara modellen ut genom användning av olika diagram, men också information om modellen struktur och sammansättning, såsom modellstorlek och begagnade variabler.

Nya diagram för modell Visualisering & Urval

Vi har nu lagt till 100+ nya sjökort för modell visualisering & analys och förbättrat de flesta av de gamla för alla modellerings kategorier. Vi har lagt till nya sjökort till Run Panelen Resultat Panel och datapanel alla modellerings kategorier, nämligen klassificering & Logistisk regression, regression & Tidsserier Prediction och Logic Synthesis. Nedan lyfts fram det viktigaste.

Klassificering & Logistisk tillbakagång

i Data Panel du nu har tillgång till ytterligare verktyg för modell urval och analys, inklusive Variabel Betydelsen Diagram och totalt nio olika Statistik Diagram (Min, max, medelvärde, median, standardavvikelse, R-kvadrat, korrelationskoefficient, lutning och skärningspunkt) förutom alla andra nya sjökort av den nya datapanelen för rörlig och spela analys, inklusive histogram. Spridningsdiagram och annorlunda linjediagram. genom att välja historia Modeller eller modell Variabler eller Allt i datakombinationsrutan på datapanelen, kan du nu göra en myriad av analyser i olika datauppsättningar och kombinationer av modeller (och modellresultat) och variabler.

regression & Tidsserie Prediction

i Run Panel och resultat Panel Vi har lagt till 3 nya sjökort för modell visualisering och analys. Scatter Plot, Förbättringar Plot, och staplade Distributions diagram.

De scatter Plot. med regressionslinjen och regressionsekvation, ger en tydlig överblick av modell passform. De Förbättringar Plot visar standard residualanalys för att upptäcka ovanliga mönster i fördelningen av residualerna. De Staplade Distributions Diagram visar tydligt spridning och överlappning av de verkliga och förutsagda värden.

Dessa 3 nya sjökort tillsattes också till resultat Panel. så att du kan utföra samma typ av modell analys för utbildning och validering / test dataset och även för olika under provtagningar av utbildning och validering / provdatamängder.

i Data Panel du nu har tillgång till ytterligare verktyg för modell urval och analys. inklusive Variabel Betydelsen Diagram och totalt nio olika Statistik Diagram (Min, max, medelvärde, median, standardavvikelse, R-kvadrat, korrelationskoefficient, lutning och skärningspunkt) förutom alla andra nya sjökort av den nya datapanelen för rörlig och spela analys, inklusive histogram. Spridningsdiagram och annorlunda linjediagram. genom att välja historia Modeller eller modell Variabler eller Allt i datakombinationsrutan på datapanelen, kan du nu göra en myriad av analyser i olika datauppsättningar och kombinationer av modeller och variabler.

Nya verktyg för Model Selection

GeneXproTools har nu nya verktyg som hjälper dig välja modeller från i princip alla panel, inklusive:

  • Tillgång till olika favorit Statistik för alla kategorier;
  • Random sub-sampling som möjliggör tillämpningen av bootstrap tekniker med större självförtroende riktigheten i dina modeller eller någon annan åtgärd av passning för att utvärdera;
  • modell navigering från alla paneler där modeller analyseras eller synlig;
  • En ny decentraliserad Radera Aktiv Modell funktionalitet som tillåter dig att ta bort någon modell du saknas i någon mening eller annan;
  • Den nya Döpa om alla modeller i historikpanelen som tillåter dig att indexera dina modeller efter sortering dem med olika statistik, så att du kan analysera dem i en viss ordning, så att du kan få en inblick i deras struktur och prestanda;
  • Nya kraftfulla verktyg för modell val i Tidsserie Prediction. nämligen att gå från testmod till förutsägelse Läge och tillbaka och ändra antalet Testing Förutsägelser, så att du kan välja modeller av deras prestanda i testuppgifter och sedan använda vissa modeller för att göra prognoser.

Införande av Evolvable Avrundnings Trösklar i klassificering

Förbättrade resultat Panelen i alla kategorier

Vi har förbättrat resultat Panel i alla kategorier, med fler och bättre diagram, en mer omfattande statistik och en rikare och mer interaktiv tabell med olika sorterings och kopieringsalternativ. Till exempel Resultat Panel för klassificering och Logistisk regressions har nu 17 Åtgärder av Fit. inklusive vanliga klassificering noggrannhet och fel, korrelationskoefficienten samt R-torget, men även området under ROC kurvan, Matthews Korrelationskoefficienten, Recall, Precision, F1 Mät och andra.

Favorit Statistik för alla kategorier

GeneXproTools kan du använda favorit Statistik inte bara i historia Panel för modell val utan också för ensemble hantering i Distribuera Ensemble till Excel-fönstret .

Förbättrad History Panel

Den största förbättringen i historia Panel är genomförandet av favorit Statistik i alla kategorier. Men andra mindre förbättringar tillsattes också, inklusive:

  • Random sub-sampling som möjliggör tillämpningen av bootstrap tekniker med större självförtroende riktigheten i dina modeller eller någon åtgärd av passning för att utvärdera;
  • Extra funktionalitet tillgänglig både via snabbmenyn och verktygsfält ikoner, såsom Radera Aktiv Modell och radera Historia ;
  • En mer omfattande sammanfattning som nu också beräknar medelvärdet av både favorit statistik och lämplighet alla modeller i historia;
  • En ny funktion för Omindexering alla modeller (Byta namn på alla modeller) som gör analysen av modeller i en viss ordning;
  • Den nya Lägg till enkla modeller funktionalitet som gör analysen av alla in- och härledda variabler som enkla modeller;
  • Och nya funktioner för Uppdatering av Avrundning Trösklar i klassificering och logistisk regression.

100 + New lämplighetsfunktioner

Vi har lagt till fler än hundra nya lämplighetsfunktioner och förbättrade gamla genom att kombinera dem med ett bredare spektrum av justerbara parametrar och mer sofistikerade straff för att undvika lokala optima och stark & mediokra attraktorer, såsom modeller som klassificerar allt som noll eller en klassificering och logistisk regression.

Nu den stora majoriteten av GeneXproTools lämplighetsfunktioner kombinerar flera mål. såsom användning av olika referens enkla modeller i alla kategorier; kostnad matris klassificering, Logistisk regression och Logic Synthesis; olika typer av avrundnings trösklar klassificering, inklusive utvecklingsbara trösklar ; undre och övre gränser för modellen utgång; parsimony tryck och variabelt tryck ; och många andra.

Justerbar sparsamhet Trycket för alla lämplighetsfunktioner

parsimony Pressure är nu en justerbar parameter som du kan finjustera mellan [0, 1] för att utöva påtryckningar på den strukturella komplexiteten i de evolverande lösningar. Den är tillgänglig för alla fitness funktioner, inklusive anpassade lämplighetsfunktioner.

Nya och justerbar variabelt tryck för alla lämplighetsfunktioner

Nu GeneXproTools stöder också variabelt tryck för alla fitness funktioner, inklusive anpassade lämplighetsfunktioner. Det är en justerbar parameter mellan [0, 1], så att du kan styra blandning av variabler i dina modeller.

Vi har också lagt till en ny Complexify knapp i Run panelen så att du kan enkelt använda variabelt tryck på en särskild lösning.

Fler parametrar för den anpassade lämplighetsfunktioner

För alla modellerings kategorier, har vi ökat antalet förväg beräknad parametrar du kan använda för att designa dina egna lämplighetsfunktioner. inklusive mycket användbara och mest använda parametrar lätt tillgängliga genom gränssnittet, såsom det kostnad matris. de utvecklingsbara tröskelvärden avrundnings. modell gränser. och många andra.

Nya genetiska Operatörer & modelleringsstrategier

Vi har lagt till 20 nya genetiska operatörer. täcker ett brett spektrum av funktioner och beteenden som du kan utforska för att designa din egen modelleringsstrategier. Från genetiska operatörer för att hitta den mest effektiva räckvidden för de slumpmässiga konstanterna (ständig finjustering & Konstant Range Finding), genetiska operatörer som ändrar endast vissa strukturer eller element i de framväxande modeller (Leaf Mutation, tendentiöst Leaf mutation, konservativ mutation, konservativa Function mutation, konservativa Permutation, tendentiöst mutation, Tail Inversion och Tail mutation), eller genetiska operatörer som injicera färskt blod i befolkningen eller öka frekvensen av särskilda modeller (Random kromosomer, Random kloning och Best kloning), kan du nu har mer kontroll över utveckling och därför kan driva det i vissa riktningar.

GeneXproTools levereras med fyra inbyggda modelleringsstrategier att täcka en del av de vanligaste modellering behov, nämligen en strategi för att finjustera de numeriska konstanter dina modeller (Ständig finjustering ); en strategi för modell finjustering där den övergripande strukturen av modellen förblir i stort sett oförändrad göra endast små förändringar i modellens struktur (Modell Fine-Tuning ); en strategi för Sub-set Val som är idealisk för att skapa goda slump skogar, särskilt för datamängder med många variabler, eftersom den fungerar endast med de element som var slumpmässigt dragna för den initiala populationen; och naturligtvis en strategi utformad för optimal Evolution som försöker ge en bra blandning av mångfald kontra stabilitet för att optimera och påskynda utvecklingen.

Dessutom GeneXproTools kan du också skapa egna modellerings strategier genom att ändra någon av de inbyggda strategier för att skapa en beställnings Strategi.

fler Variabler & Obegränsad Ensemble Storlek

Vi har utökat antalet oberoende variabler i alla utgåvor, nu med max 20 variabler för standard utgåva. 100 för Avancerad och 1000 för Professionell.

Vi har också tagit bort alla begränsningar på ensemble storlek i alla GeneXproTools upplagor. Så nu kan du distribuera ensembler till Excel av valfri storlek du behöver.

Nya verktyg för att skapa Ensembler & slumpmässiga skogar

Vi har infört nya verktyg för att skapa ensemble modeller eller GEP skogar. inklusive nya träningsfunktioner, nya genetiska operatörer, urval strategier delmängd favorit statistik, obegränsad ensemble storlek för extern ensemble utplacering till Excel, ensemble utplacering av dataskyddat läge, genomsnittlig sannolikhet multi-modell & median sannolikhet flera modell för klassificering och Logistisk regressions, olika säcksystem och olika stoppvillkor.

Nya programmeringsspråk: R, Octave & Excel VBA

Vi har nu lagt till 3 nya grammatiker till den redan omfattande lista över stöd programmeringsspråk för automatisk modell kodgenerering. De R Språk. Oktav och Excel VBA är nu en del av 19 inbyggda grammatiker av GeneXproTools (Ada, C, C ++, C #, Excel VBA, Fortran, Java, JavaScript, Matlab, Octave, Pascal, Perl, PHP, Python, R, Visual Basic, VB.NET, Verilog och VHDL) som gör att du kan export automatiskt alla modeller till någon av dessa programmeringsspråk.

Förbättringar i genererad Model Code

Vi har ändrat genomförandet av funktioner som rör ternära operatören för att undvika mycket långa rader kod, genomföra dessa funktioner som de olika metoderna. Vi har också förbättrat grammatiker. bara förklara numeriska konstanter och variabler som används i modellen, förbättra tydligheten i modellkoden.

3 Olika former av modelleringsresultat för klassificering & Logistisk tillbakagång

Vi har nu genomfört i alla GeneXproTools paneler stöd för 3 olika former av mod för klassificering och logistiska regressionsmodeller, nämligen Sannolikhet [1]. Troligtvis Klass och Rå Modell Effekt.

Internt GeneXproTools ger dig tillgång till dessa 3 olika former av modellens resultat i Data Panel. för både klassificering och logistiska regressionsmodeller.

i resultat Panel och för Logistic Regression, har du också tillgång till 3 olika former av modellens resultat. För klassificering, visar emellertid GeneXproTools bara rå modellens resultat och den förutspådda klassen i resultatpanelen. De sannolikheter för klassificeringsmodeller finns tillgängliga i Data Panel och genom modell poäng, antingen i scoring Panel eller genom modell / ensemble utplacering till Excel.

För scoring dina modeller internt i GeneXproTools i scoring Panel. du kan också välja någon av dessa 3 typer av modellens resultat för klassificering och logistiska regressionsmodeller. Detta är också sant för Modell & Ensemble Distribution till Excel.

Slutligen, all kod som genereras av GeneXproTools i någon av de stödda programmeringsspråk för matematiska modeller (Ada, C, C ++, C #, Excel VBA, Fortran, Java, JavaScript, Matlab, Octave, Pascal, Perl, PHP, Python, R, Visual Basic, och VB.Net) genomför även 3 olika former av modellens resultat: Sannolikhets [1], troligen klass och råvaror Modell Effekt, som du väljer direkt i modell Panel.

Ensemble Distribution till Excel med Genomsnitt & Median sannolikhetsmodeller

Nu för Logistic Regression och klassificering, kan du välja Sannolikhet [1] som utgång för dina modeller, både för ensemble och modell utplacering till Excel. För ensemble distribution vi har lagt till nya genomsnittliga sannolikhetsmodell och mediansannolikhetsmodell. med tröskelvärdena för sannolikheterna lätt justerbara i Excel.

Ensemble Distribution utan inbäddad kod

Nu GeneXproTools stöder också ensemble och modell utplacering till Excel i dataskyddat läge. det vill säga utan att bädda modellkoden. Detta är särskilt användbart om du arbetar med stora ensembler och stora datamängder, särskilt i ensemblen utvärderingsfasen när du behöver för att snabbt utvärdera olika kandidat lösningar.

Nya Linking Funktioner

Vi har nu lagt till ytterligare 3 bindningsfunktioner. Avg2, Min och Max, som alla kan enkelt läggas till din egen grammatik. De Avg2 bindningsfunktion fungerar särskilt bra med tidsseriedata. producera bättre modeller genom att förhindra autokorrelation, och därför är nu den nya standard i tidsserier Prediction.

Förbättrad Expression Tree Display

Nu kan du få tillgång till etiketter i alla variabler i expressions träd med hjälp av verktygstips. GeneXproTools visar även definitionerna av alla de funktioner och värdena på den numeriska konstanter i trädet representation av modellkoden.

Nya stand.inst för funktionen Set

Vi skapade nya defaults för funktioner uppsättningar av alla kategorier i ett försök att skapa en ännu bättre startpunkt för så många olika problemområden som möjligt.

Vi har också lagt till nya funktioner till funktioner Panel så att du kan nu få tillgång till alla dessa olika funktion set standard från olika modelleringskategorier.

Import Funktion Set

Vi har infört en ny funktion för importera funktionsuppsättningar från andra GEP filer. Detta omfattar även importera koden för alla anpassade funktioner utformad för en viss körning.

Import härledda variabler

GeneXproTools låter dig importera koden av alla nya härledda variabler du har skapat. Så nu behöver du inte längre att kopiera och klistra in koden på din favorit härledda variabler eller rörliga transformationer från en körning till en annan. Du måste bara skriva dem en gång och enkelt få tillgång till dem genom Import härledda variabler meny.

Analys av enkla modeller

GeneXproTools kan du nu Lägg till enkla modeller till historia så att du kan analysera och även jämföra dem med dina modeller. De enkla modeller som du kan lägga automatiskt till historien omfatta all ursprungliga variabler i data och alla härledda variabler du har skapat.

Nya diagram för övervakning Evolution

I Kör Panel GeneXproTools visar nu histogram av fitness värden och programstorlekar för varje generation av framväxande modeller. Detta är särskilt användbart om du designa din egen lämplighetsfunktioner eller skapa din egen modelleringsstrategier genom att justera priserna för genetiska operatörer.

New stoppvillkor

Vi har introducerat sex nya stoppvillkor. varav några är mycket användbart för att skapa bra ensembler eller slump skogar, såsom Slumpmässig Generation Number. Slumpmässig Fitness Tröskel. Random R-kvadrat Threshold och Slumpmässig Noggrannhet Tröskel. Dessa stoppvillkor kan du välja gränserna för nedre och övre värdet för antalet generationer, kondition, R-offentlig noggrannhet, så att du kan stoppa designprocessen i olika skeden, vilket gör att du kan skapa mycket mer olika ensembler av modeller.

Nya hjälpsystemet

Vi har nu infört ett nytt elektroniskt hjälpsystem. ger dig med ständigt uppdaterade material som vi kommer att uppdatera och förbättra svar på användarnas behov.

Listan över mindre förbättringar och funktioner läggas till GeneXproTools 5.0 är mycket stor, men nedanför hittar du den mest framträdande av dem.

Förbättrad Klassificering Tapestry

Nu, om inga modeller finns i historien, den nya klassificering Tapestry visar bara fördelningen av positiva och negativa i responsvariabeln.

Den nya klassificeringen Tapestry använder också en annan färgschema när noggrannheten ligger under 50% -strecket, vilket kan ske inte bara för svaga mellanliggande lösningar men också för goda inverterade modeller när lämplighetsfunktioner som selekterar för både positiva och negativa korrelationer används. R-kvadratiska och Symmetric ROC fitness funktioner Logistisk regressions är exempel på sådana lämplighetsfunktioner.

Förbättrat Alla kurvanpassning Charts

Alla Kurvanpassning Charts Regressions- och tidsserie Prediction förbättrades med en bättre design och genom att lägga till extra funktionalitet, såsom zoomning, visar etiketter, legend, titlar, verktygstips och stödlinjer.

Förbättrat Alla Binomial Fitting Charts

Den gamla Binomial Monterings Diagram av Logistisk regression förbättrades med en bättre design och genom att lägga till extra funktionalitet, varav det viktigaste är plotta avrundningsgränsen och belysa felklassificeringar. De nya (alla tre Binomial Montering Diagram för klassificering och den helt nya Binomial Fitting diagram Sorterat efter Target & Modell) skapades också med liknande design och funktioner.

Förbättrade Logistisk regressionsFönster Charts

Diagrammen för kvantil Regression. cutoff Points. Log Odds och Logistic Fit av Logistisk regressions Fönster förbättrades också och omgjorda.

Omvandling av Logistic Regression går till klassificering

Nu, tack vare införandet av Evolvable trösklar avrundning. de omvandling av Logistic Regression går till klassificering sker felfritt för alla modeller i Kör historia. Genom att ställa in avrundningsgränsen till logistiska Trösklar. Det är nu möjligt att få den unika logistiska tröskeln varje logistisk regressionsmodell till klassificering plattformen.

Förbättrad Ändra Seed Fönster

Nu i Förändring Seed Fönster du kan kopiera & klistra in hela uppsättningen numeriska konstanter på en gång eller kopiera & klistra bara de numeriska konstanter på en särskild gen.

New Complexify Button i Kör Panel

variabelt tryck infördes i version 5.0 och vi har också lagt till en Complexify knapp till Run panelen, vilket ger dig ett enkelt sätt att styra blandningen av variabler i dina modeller.

Nya metoder för panelrapporten

Nu GeneXproTools låter dig välja mellan en Hela rapporten och en kort Rapportera. Den fullständiga rapporten visar en lista över alla modeller i Run historia, medan den korta rapporten visar bara den aktiva modellen. Att välja den kortare versionen är lämpligt för mycket stora historier med hundratals eller tusentals modeller.

Vi har förbättrat Anmärkningar Editor av GeneXproTools med en större och bättre fönster och också lättare tillgång till Notes Editor genom rapporter Meny.

New Code Editor för Custom Fitness

Vi har förbättrat Kod Redaktör för Custom Fitness funktionen genom en större och bättre fönster och användningen av olika färger för JavaScript nyckelord, kommentarer och konstanter.

Förbättrad användardefinierade funktioner Fönster

Vi har förbättrat Dynamisk UDF Fönster med en ny kombinationsruta för antalet argument och en ny kod Editor som nu tillåter användning av olika färger för JavaScript nyckelord, kommentarer och konstanter.

Förbättrad Härledda variabler Fönster

Vi har förbättrat UDF Fönster. vilket är fönstret för att generera nya härledda variabler, med en ny kod Editor som nu lyfter i olika färger alla JavaScript nyckelord, kommentarer och konstanter. Vi har också lagt till nya funktioner för att kopiera utgången av varje prov.

Extra funktioner i funktioner Panel

Nu den Välj alla och Klar knappar fungerar mer intelligent, välja / rensa endast de funktioner som är synliga.

Vi har också lagt till en ny funktion som gör att du kan kopiera alla delmängder av funktioner visas i Funktioner Tabell, vilket är användbart för att utforma och studera egna funktionsuppsättningar.

Vi har gjort det Hem Panel av GeneXproTools, ger dig tillgång till en större lista över De senaste körningar. Vi har också lagt till en lista över Användbara länkar för att få hjälp och stöd och enkel tillgång till den nya diskussionsforum.

Nytt system för att identifiera modellering Kategorier

Nu i GeneXproTools 5,0 vi färgkoda varje modellering kategori att bidra till snabb identifiering av modellkategori varje körning och göra allt mer, väl, färgglada.

Vi har skapat nya Exempel Runs för denna version så att du kan enkelt utforska alla de nya funktionerna i GeneXproTools 5,0, såsom stöd för kategoriska variabler och saknade värden. stödet för flera klasser i klassificering och Logistisk regressions, uppgifter normalisering. undersamplings. och så vidare.

Till exempel, den Klassificering provkörn iris Växter har 3 klasser (tuviris, brokiris och Iris virginica), så att du kan utforska med lätthet hur man hanterar flera klasser i klassificering. De satellitbilder provkörningen spelar en liknande roll för Logistisk regressions, med 6 klasser i det här fallet. De Credit Godkännande prov körda erbjudanden med standardiserade data. Vissa dataset av de nya provkörningar har saknade värden (kreditgodkännande, Breast cancer, diabetes och bränsleförbrukning), medan andra använder en blandning av kategoriska och numeriska variabler (kreditgodkännande, bröstcancer, Iris växter, lån Risk, satellitbilder och emotiv EEG).

För alla benchmark provkörningar som handlar med välkända datamängder, använde vi de ursprungliga datamängder som tillhandahålls av givarna så att du kan jämföra och återge några andra studier med hjälp av dessa datamängder. Att återgå till den ursprungliga datamängden, bara att trycka på ursprungliga knapp i Dataset Partitione Fönster.

Nya stand.inst för genetisk Operatörer

Med så många nya genetiska operatörer var vi tvungna att justera sina priser för att göra det bästa av evolutionen. Dessutom, nu alla genetiska aktörer genomförs probabilistiskt, så nu kan du använda mycket små priser och ändå få dem att fungera probabilistiskt över längre tidsperioder. Och slutligen, kommer var och en av de nya modelleringsstrategier med specifika standardinställningar som du kan använda varje gång du väljer en särskild strategi.

Förbättrad Evolutionary Dynamics An

Diagrammet för att övervaka evolutionär dynamik i Kör Panel förbättrades med en bättre design och genom att lägga till stöd för zoomning, etiketter, legend, titlar och bättre verktygstips.

Förbättrad Vanlig / Bästa storlekstabell

Diagrammet för visualisering förändringarna i Bästa storlek och genomsnittlig storlek under evolutionen förbättrades med en bättre design och genom att lägga till stöd för zoomning, etiketter, legend, titlar och bättre verktygstips.

Förbättrad delprogram Storlekar diagram

Vi har förbättrat Delprogram Storlekar diagram i Kör Panel med en bättre design och genom att lägga till extra funktionalitet för etiketter och kopiera sjökortsdata.

Förbättrad alla storlekar Diagram & Alla Fitnesses An

Vi har också förbättrat Alla storlekar diagram och Alla Fitnesses An i Kör Panel med en bättre design och genom att lägga till stöd för etiketter och kopiera sjökortsdata.

Förbättrad navigering av alla diagram

Vi har nu förbättrat navigering av alla diagram i Run Panel och resultat Panel genom användningen av pilar som arbetar i samklang med en särskild kombinationsrutan. Så nu är det mycket lättare att gå fram och tillbaka mellan olika diagram både under evolutionen i Run Panelen och under modellanalys i resultatpanelen.

Ny sorteringsverktyg i resultatpanelen

Vi har nu lagt skiv ID: n till alla resultattabellerna och utvidgade sorteringsalternativ i alla modellerings kategorier.

Fler kopieringsalternativ för resultattabellerna

Vi har utökat antalet kopieringsalternativ för resultat Tabell i alla modellerings kategorier i syfte att inkludera alla de nya tillägg till resultattabellerna, t.ex. Kopiera Sannolikhet [1] i logistisk regression.

Ny anpassad lämplighetsfunktioner Exempel

Nu den Custom lämplighetsfunktioner exempel för klassificering. Logistisk regression och Logic Synthesis är implementeringar av en enkel träningsfunktion baserad på klassificering Noggrannhet. För Regression och tidsserier Prediction vi nu genomföra en lämplighetsfunktion baserad på RMSE.

Vi skapade nya exempel för matematik och Boolean anpassade funktioner i syfte att tillhandahålla mer användbara exempel som är mer intressant att använda.

Vi har förbättrat några standardvärden för saker att köra ännu smidigare:

  • Vi har ändrat Funktions Set defaults i alla modellerings kategorier för att skapa ännu mer exakta modeller och fungerar bra med de nya genetiska operatörer;
  • I Tidsserie Prediction Vi har ändrat betydligt Funktion Ange standard i syfte att göra det bästa av den nya Avg2 bindningsfunktion standard ;
  • nu alla lämplighetsfunktioner med justerbara parametrar kommer med förinställda standardvärden för att hjälpa dig att göra det bästa av dem utan att förstå deras inre arbetet i alla detaljer. Dessa standard återställa varje gång du byter träningsfunktionen så att du alltid har en bra utgångspunkt.

"Slutligen, en världsklass användargränssnitt inom genetisk programmering och evolutionära beräkning. GeneXproTools är helt enkelt oöverträffad i sin fantastiska användargränssnitt, bredden av dess lämplighet funktioner, valfrihet och flexibilitet i matematik och logik funktioner, tydligheten i sitt slutliga modellen presentation, och en inbyggd panel för Scoring nya data, direkt i gränssnittet. Denna typ av funktionalitet och användarvänlighet har aldrig sett förut inom genetisk programmering. Dessutom, Dr Ferreira specifika metoder för Gene Expression Programmering gör viktiga bidrag till området för evolutionära beräkning, och de olika algoritmer som hon har utvecklat och distribueras inuti GeneXproTools är briljant havande och hennes metoder utvecklas starkt prediktiva modeller som löser verkliga affärsproblem. GeneXproTools är en extraordinär strukturell tour de force."

Brian C. Watt, CRM
Chief Risk Officer / Chief Financial Officer
GECC Inc, USA

"Jag har använt GeneXproTools mot en mängd av läkemedelsforskningsrelaterade problem och har hittat GUI för att vara lätt användas och väl anpassade till de olika stadierna i prognosmodeller. "

Steven J Barrett, Ph.D
Principal Scientist
Nya tillämpningar Team
Data Exploration Sciences GlaxoSmithKline

"Gene Expression programmering, i kombination med GeneXproTools, låt oss här på Mercator Geosystems för att utforska nya och spännande metoder för rumsligt modellera sambandet mellan ett företags butiker och deras kunder. Den GeneXproTools programvara är enkel att använda, väl utformade och mycket flexibel. Särskilt möjligheten att ladda träningsdata från en databas, och möjlighet att skapa modeller i programspråket i vårt val, verkligen göra denna produkt sticker ut. Produktsupport är utmärkt och mycket lyhörda – rekommenderas varmt!"

Steve Hall
Mercator GEOSYSTEMS Ltd
Storbritannien

Glenn Lewis
Mjukvaruutvecklare, USA

"Jag har arbetat som en kust ingenjör och matematiska modellerare för mer än 10 år och nu jag använder GeneXproTools att upptäcka komplexa ickelinjära förhållanden som råder i hydrauliska och våg processer. Till exempel, GeneXproTools hjälpte nyligen mig etablera flera explicita approximationer till Wave Dispersion ekvation och nu med den nya versionen, som tillåter flera oberoende variabler, fitness funktioner och obegränsad poster, planerar jag att utveckla mina egna formler för att utvärdera den våg overtopping av vågbrytare och seawalls. Tack Gepsoft för att ge en så spännande, kreativ och användbar verktyg för det vetenskapliga samfundet."

Ricardo Carvalho
PROMAN – Centro de Estudos & Projectos, SA
Lissabon, Portugal

"GeneXproTools används för att titta på problem med parasit populationer, där data är mycket skev. Resultaten med hjälp GeneXproTools är betydligt bättre än de som erhålles med användning av konventionella statistik."

Prof John Barrett
Chef för parasitologi Group
University of Wales, Storbritannien

Källa: www.gepsoft.com

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

1 × två =