Am încercat să execut acest cod în Windows și a funcționat impecabil, dar în Ubuntu, de îndată ce rulez acest cod, Ubuntu se blochează timp de 3-4 minute și apoi vine rezultatul și apoi Ubuntu se comportă întârziat până îl repornesc.
import numpy ca np
import panda ca pd
din sklearn.preprocessing import StandardScaler
din sklearn.model_selection import train_test_split
din preprocesarea importului sklearn
de la xgboost import XGBClassifier
importați xgboost ca xgb
din sklearn.metrics import accuracy_score
dataset_len = 40000000
dlen = int(dataset_len/2)
X_11 = pd.Series(np.random.normal(2,2,dlen))
X_12 = pd.Series(np.random.normal(9,2,dlen))
X_1 = pd.concat([X_11, X_12]).reset_index(drop=True)
X_21 = pd.Series(np.random.normal(1,3,dlen))
X_22 = pd.Series(np.random.normal(7,3,dlen))
X_2 = pd.concat([X_21, X_22]).reset_index(drop=True)
X_31 = pd.Series(np.random.normal(3,1,dlen))
X_32 = pd.Series(np.random.normal(3,4,dlen))
X_3 = pd.concat([X_31, X_32]).reset_index(drop=True)
X_41 = pd.Series(np.random.normal(1,1,dlen))
X_42 = pd.Series(np.random.normal(5,2,dlen))
X_4 = pd.concat([X_41, X_42]).reset_index(drop=True)
Y = pd.Series(np.repeat([0,1],dlen))
df = pd.concat([X_1, X_2, X_3, X_4, Y], axa=1)
df.columns = ['X1', 'X2', 'X3', 'X_4', 'Y']
df.head()